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本 书 针 对 Python 零 基础 的 用 户 , 主要 讲解 大 量 的 股票 指标 技术 分 析 的 范例 , 由 浅 入 深 地 介绍 了 使 用 Python 
语言 编程 开发 的 应 用 “图 谱 ”。 

全 书 分 为 三 篇 : 基础 篇 (第 1~4 章 ) : 讲述 Python 开发 环境 的 搭建 、 基 本 语法 、 数 据 结 构 、 代 码 的 调试 
以 及 面向 对 象 的 编程 思想 ;股票 指标 技术 分 析 篇 (第 5~10 章 ) : 分 别 讲述 使 用 网 络 疏 虫 技术 获取 股票 数据 ， 
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OBV 指标 分 析 为 范例 讲述 在 Django 中 导入 日 志和 数据 库 组 件 ， 结 合股 票 指标 分 析 讲 述 基于 线性 回归 和 SVM 

(支持 向 量 机 ) 的 机 器 学 习 的 入 门 知识 。 
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程序 也 可 单独 作为 参考 用 例 。 
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如 果 你 对 股票 大 数据 分 析 感 兴趣 ， 又 想 学 习 一 门 适合 进行 这 类 大 数据 分 析 的 通用 语言 ， 那 么 
本 书 一 定 是 不 错 的 选择 。 

从 知识 体系 上 来 看 ， 本 书 的 内 容 涵盖 Python 项 目 开 发 所 需 的 知识 点 ， 包 括 Python 基础 语法 知 
识 、 基 于 Pandas 的 大 数据 分 析 技 术 、 基 于 Matplotlib 的 可 视 化 编程 技术 、Python 怜 虫 技术 和 基于 
Django 的 网 络 编程 技术 ， 在 本 书 的 最 后 章节 ， 讲 述 入 门 级 的 机 器 学 习 编程 技术 。 

本 书 的 作者 具有 多 年 Python 的 开发 经 验 ， 详 熟 Python 高 级 开发 所 需要 掌握 的 知识 体系 ,也 非 
常 清楚 从 零 基础 学 Python 升级 到 应 用 开发 可 能 会 走 的 弯路 ， 所 以 在 本 书 的 内 容 安排 上 : 第 一 ， 对 
Python 零 基 础 人 群 讲述 必要 的 知识 点 ;第 二 ， 在 讲述 诸多 知识 点 时 都 结合 实际 的 范例 程序 ， 第 三 
在 针对 具体 范例 程序 讲解 时 ， 会 见缝插针 地 讲述 从 范例 项 目 程序 中 提炼 出 来 的 开发 经 验 。 

本 书 的 大 多 数 范例 程序 基于 股票 分 析 的 技术 指标 ， 部 分 范例 程序 还 结合 了 “机 器 学 习 ” 和 “把 
虫 ”的 使 用 。 比 如 ， 根 据 股 票 代码 爬 取 股票 交易 数据 的 范例 程序 来 讲述 爬虫 技术 和 正则 表达 式 ， 通 
过 线 均线 和 成 交 量 图 的 范例 程序 来 讲述 Matplotlib 知识 点 ， 结 合股 票 技术 指标 BIAS 和 OBYV 的 
范例 程序 来 讲述 Django 框架 ， 用 股票 走势 预测 的 范例 程序 来 讲述 机 器 学 习 。 在 用 股票 分 析 的 范例 
程序 讲述 知识 点 的 同时 ， 还 会 给 出 验证 特定 指标 交易 策略 的 范例 程序 源 代 码 。 

作者 相信 用 这 些 饶 有 兴趣 的 范例 程序 来 学 习 Python， 可 以 激发 读者 学 习 的 兴趣 ， 也 就 不 用 担 
心 在 学 习 过 程 中 半途 而 废 。 而 且 ， 本 书 的 范例 程序 大 多 篇 幅 适 中 ， 对 于 进行 课程 设计 或 大 学 毕业 设 
计 的 读者 ， 本 书 也 非常 适合 作为 参考 用 书 。 

如 果 读 者 对 股票 交易 知之 甚 少 ， 也 不 用 担心 无 法 看 懂 本 书 中 的 股票 分 析 范 例 程序 ， 这 是 因为 

@ 本 书 以 通俗 易 懂 的 文字 讲述 相关 股票 指标 的 含义 和 算法 ; 

e@ 在 给 出 待 验证 的 股票 交易 策略 时 ， 所 用 到 的 数学 方法 仅 限于 加 减 乘除 

@ 在 用 股票 预测 范例 程序 讲述 机 器 学 习 时 ， 计 算 方 差 用 到 的 最 复杂 的 数学 公式 只 是 二 次 函 

数 ， 这 是 初中 数学 的 知识 。 


由 于 本 书 是 结合 股票 分 析 的 范例 带领 读者 入 门 Python 语言 ， 因 此 在 读 完 本 书 之 后 ， 大 家 不 仅 
能 掌握 Python 开发 所 需 的 知识 点 ， 而 且 还 能 对 股票 技术 指标 乃至 基于 股票 指标 的 交易 策略 有 一 定 
的 理解 。 

为 了 让 本 书 的 读者 能 高 效 地 理解 本 书 的 范例 和 知识 点 ， 作 者 在 编写 本 书 时 ， 处 处 留心 、 字 字 
其 柄 ， 将 书 中 所 有 范例 程序 代码 均 按 行 编号 ， 读 者 在 阅读 时 能 看 到 大 量 “ 某 行 的 代码 是 X X 含 义 ” 
这 类 说 明 , 这样 做 的 目的 是 希望 帮助 读者 没有 遗漏 地 掌握 各 知识 点 的 应 用 。 再 者 ， 本 书 组 织 的 文字 
里 ， 尽 量 避 免 艰深 、 星 涩 的 “技术 行 话 ”， 而 是 用 朴素 的 文字 ， 由 浅 入 深 地 讲述 Python 语言 的 应 
用 要 点 。 

本 书 在 编写 过 程 中 ， 得 到 了 成 立 明 老师 的 大 力 支持 ， 她 负责 了 本 书 第 2~7 章 的 编写 工作 ， 在 
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此 表示 诚 执 的 感谢 。 由 于 学 识 浅 陋 ， 书 中 难免 有 下 漏 之 处 ， 敬 请 读者 批评 指正 。 
本 书 为 读者 提供 多 媒体 视频 教学 及 范例 程序 的 完整 源 代码 ， 请 扫描 下 方 的 二 维 码 获 取 下 载 : 


如 果 下 载 有 问题 ， 请 电子 邮件 联系 booksaga@126.com， 邮 件 主题 为 “ 求 基于 股票 大 数据 分 析 
的 Python 入 门 实战 (视频 教学 版 )” 
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掌握 实用 的 Python 语法 


Python 的 语法 不 少 ， 但 在 实际 项 目 中 并 不 是 所 有 语法 都 经 常 使 用 。 本 章 在 介绍 基本 语法 时 ， 
不 会 罗列 出 不 常用 的 知识 点 ， 是 结合 大 多 数 项 目的 实际 需求 ， 引 导 大 家 用 比较 高 效 的 方式 入 门 
Python 。 

怎么 才能 算 入 门 Python 语言 了 呢 ? 首先 能 在 开发 环境 中 顺利 运行 第 一 个 Python 程序 , 其 次 是 
能 通过 运用 基本 数据 结构 ，if...else 条 件 分 支 语句 ， 或 循环 语句 开发 出 较 具 规模 的 代码 ， 然 后 是 可 
以 自 定义 函数 和 调用 函数 。 

大 家 在 阅读 本 章 时 ， 可 以 根据 本 书 给 出 的 步骤 调试 代码 ， 并 通过 阅读 书 中 的 相关 解释 快速 党 
握 Python 的 实用 性 语法 。 


1.1 安装 Python 开发 环境 


相对 于 Java 比较 适用 于 互联 网 编程 领域 (尤其 是 高 并 发 的 分 布 式 领域 ) ，Python 在 “数据 分 
析 ”“ 图 形 绘制 ”“ 网 络 息 虫 ” 和 “人 工 智能 ”等 领域 独树一帜 ， 这 也 是 当前 Python 非常 流行 的 
一 部 分 原因 。 本 书 将 使 用 MyEclipse， 通 过 在 其 中 安装 PyDev 插件 包 的 方式 来 搭建 开发 环境 。 


1.1.1 在 MyEclipse 里 安装 开发 插件 和 Python 解释 器 


通过 PyDev 插件 ， 我 们 可 以 在 开发 Python 时 享受 到 “提示 语法 错误 ”和 “代码 编辑 提示 ”等 
的 诸多 便利 ， 在 MyEclipse 中 安装 PyDev 插件 的 具体 步骤 如 下 。 

C201 到 PyDev 官网 上 下 载 该 插件 包 ， 本 书 用 到 的 是 2.7.1 版 本 。 解 压缩 后 ， 把 它 复制 到 
MyEclipse 的 dropins 目录 中 ， 如 图 1-1 所 示 。 

注意 ， 复 制 完 成 后 ， 对 应 的 目录 结构 是 在 dropins\python 目录 中 有 两 个 文件 夹 。 而 且 ， 这 里 的 
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2.7.1 是 PyDev 的 版 本 号 ， 不 是 Python 语言 的 版 本 号 。 


辕 c:\Docanents and Settings\Adninistrator\lyEclipse Professional 2014\dropins\python 


图 | plugins 


1-1 把 PyDev 复制 到 MyEclipse 的 dropins 目录 中 


E3702 由 于 Python 是 解释 型 语言 ， 因 此 我 们 还 需要 下 载 Python 的 解释 器 ， 本 书 用 到 的 安装 
包 是 Python-3.4.4.msi。 下 载 完成 后 ， 双 击 该 安装 包 开 始 执行 安装 ， 本 书 选 择 的 安装 路 径 是 
Di:\Python34， 安 装 完成 后 ， 就 能 在 该 目录 下 看 到 有 python.exe 这 个 解释 器 程序 ， 也 就 是 说 ， 本 书 
到 的 语法 是 基于 Python3 的 。 


完成 上 述 两 个 步骤 后 ， 我 们 还 需要 在 MyEclipse 里 配置 Python 的 解释 器 ， 具 体 做 法 是 ， 依 次 
单 击 菜单 项 “Window ”一 “Preferences”, 在 弹出 的 对 话 框 的 左 侧 找到 PyDev, 并 在 Interpreter -Python 
这 个 选项 中 ， 通 过 New 按钮 导入 Python 的 解释 器 ， 如 图 1-2 所 示 。 请 注意 ， 导 入 的 解释 器 路 径 需 
要 和 刚才 安装 的 路 径 保持 一 致 。 

这 里 请 注意 ， 如 果 大 家 更 换 了 开发 所 用 的 工作 空间 (Workspace) ， 则 需要 在 新 的 工作 空间 重 
新 导入 解释 器 ， 否 则 就 会 无 法 创建 项 目 乃 至 无 法 开发 Python 程序 。 


Python Interpreters 
Python interpreters (eg ; python «xe) 


me Lecetion 
国 pythen3 4.4 DD \Python34\python exe 


BN Libraries Forced Builtins | Predefined | a Enviroment | ® String Substitution Varisbles 
System PITHONPATH 
SB System Libs 


而 D:\Python34\DLLs 

阐 D:\Python34Uib 

而 D:\Python34 

而 Di Pythonr3t\lib\siterpackages 

曾 ci Docments snd Settings\Adninistrator\Application Data\Pythen\Python34\site-packages\nanpy 


转 内 ndowBuilder 


图 1-2 导入 Python 解释 器 的 示意 图 


1.1.2 ”新 建 Python 项 目 ， 开 发 第 一 个 Python 程序 


通过 上 述 步 又 搭建 好 Python 的 开发 环境 后 , 就 能 通过 如 下 的 步骤 来 创建 第 一 个 Python 项 目 和 
Python 程序 。 


ET) 通过 “File” 一 “New” 的 菜单 命令 新 建 项 目 ， 项 目的 类 型 是 “PyDev" ， 如 图 1-3 所 


示 。 
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Nobile Search Run Window Help 


了 ait Source Refactoring JNavigate Project MyEclipse Pydev 
ALttShiftth » 


Open File.. 


Close CtrltW BSource Folder 
Close 各 1 CtrltShiftth | 南 pyDev Package Ed 
回 PyDev Module 
Folder 
Brile 


要 Untitled Text File 
Ctrl4 


站 Qther. 
1-3 ”通过 New 菜单 命令 创建 Python 项 目 
在 第 一 次 创建 项 目 时 , 未 必 能 在 New 菜单 中 看 到 PyDev Project 的 选项 , 这 时 可 以 单 击 “Other” 
菜单 选项 ， 而 后 在 如 图 1-4 所 示 的 界面 中 选择 “PyDev Project”。 


irards: 


图 14 通过 Other 菜单 命令 选择 PyDev Project 
上 述 哪 种 方式 , 单 击 “PyDev Project” 选 项 后 , 就 能 看 到 如 


图 1-5 所 示 的 界面 。 


EZ? 不 管 
在 图 1-5 所 示 的 界面 中 , 可 以 输入 项 目 名 为 MyFirstPython, 选择 “Create 'src' folder and add it to 
the PYTHONPATH” 选 项 ， 其 他 选项 都 可 以 选择 默认 项 ， 随 后 单 击 “Finish” 按 钮 即 可 完成 项 目的 


创建 。 
在 图 1-5 中 ， 需 要 选择 语法 版 本 为 “3.0”， 同 时 选用 python3.4.4 作为 解释 器 。 
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PyDev Project 
Create a new Pydev Project. FE 


Broject name; [Firstpython 


Project contents 


Use default 


Project type 
Choose the project type 
Python OJython OIron Python 


Grammar Yersion 


3.0 司 


OAad project directory to the PITHONPATH? 
Create sre folder and add it to the PITHONPATH? 
ODon t configure PYTHONPATH (to be done msnually later on) 


®@ Chat > ][L_ pnia ][L caeu 
图 1-5 填写 Python 项 目的 相关 信息 


C003 在 创建 好 项 目 后 ， 在 该 项 目的 src 目录 上 ， 单 击 鼠 标 右键 ， 在 弹出 的 快捷 菜 间 


选择 “New” 一 “PyDev Module" ， 创 建 PyDev Module， 如 图 1-6 所 示 。 


中 依次 


转 PyDev package Explorer x 


日 芒 NyFirstPython 
[zw ， 叶 
Sm "Es 
se 7 [I Project, 


加 File 


首 Folaer 


所 HTWL (Advanced Templates) 
所 XHTML (Advanced Templates) 
XML (Advanced Templates) 


轿 PyDev Nodule 
PyDev Package 


1-6 创建 PyDev Module 的 示意 图 


了 3 Inport 


在 弹出 的 如 图 1-7 所 示 的 对 话 框 中 ， 输 入 文件 名 为 “HelloPython”， 再 单 击 “Finish ”按钮 ， 


即 可 创建 一 个 py 文件 。 
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Create a hew Python module 


Source Folder |/WyFirstPython/sre 


Package 


CLIT (areparse) 
CLT (optparse) 
Tonplate | [i 
Unittest 
Vnittest with setlp and tearDorn 


1-7 输入 Python 文件 名 
G704 完 成 上 述 步骤 后 ， 在 sre 目录 中 可 看 到 HelloPython.py 文件 ， 在 其 中 编写 如 下 代码 。 


#Print Hello World 

print ("Hello World") 

#calculate sum 

sum=0 

for i in range(11) : 
sum += i 

Print (sum) 


其 中 ， 第 1 行 和 第 3 行 是 注释 。 在 第 2 行 里 ， 通 过 print 语句 输出 了 一 段 话 。 在 第 5 行 和 第 6 
行 里 ， 使 用 for 循环 执行 了 1 到 10 的 累加 和 ， 并 在 第 7 行 输出 累计 和 的 结果 (结果 是 55) 。 


CV05 完成 代码 编写 后 , 可 以 在 代码 的 空白 位 置 单 击 鼠 标 右键 , 在 随后 弹出 的 菜单 项 中 , 依 
次 选择 菜单 项 “Run As” 一 “Python Run"， 即 可 运行 代码 ， 如 图 1-8 所 示 。 


auwmwewNP 


加 Hellopython x BE ou 
[ 
Undo Typing Ctrltz [ 
人 0° 
Open With » 
Shox In ALttShiftHy » 
诊 copy Context qualified Nae 
Paste Ctrlty 
Quick Fix Ctrl 
Shift Right 
Shift Left 
Erofile js » 
» 
are With ?2 Python unit-test 


图 1-8 运行 Python 程序 的 示意 图 
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运行 之 后 就 能 在 控制 台中 看 到 程序 的 输出 结果 ， 如 图 1-9 所 示 。 


1-9 查看 运行 的 结果 


1.2 ”快速 人 门 Python 语法 


结 


行 结果 理解 关 


在 入 门 阶段 ， 我 们 建议 的 学 习 方 法 是 : 先 运行 书 中 给 出 的 范例 程序 ， 再 通过 运 
法 i 导致 程 


键 代码 的 含义 。 开始 不 建议 大 家 直接 动手 编写 代码 , 因为 这 样 很 容易 由 于 细小 的 语 
序 无 法 运行 ， 不 断 的 挫败 感 会 让 学 习 积极 性 逐渐 消退 。 


到 汀 


1.2.1 ”Python 的 缩 进 与 注释 


Python 语言 不 是 用 大 括号 来 定义 语句 块 ， 也 没有 用 类 似 End 之 类 的 结束 符 来 表示 语句 块 的 结 
束 ， 而 是 通过 缩 进 来 标识 语句 块 的 层次 。 大 家 能 在 之 前 的 HelloPython 范例 程序 中 体会 到 这 一 点 。 
注释 是 代码 里 不 可 或 缺 的 要 素 ， 之 前 我 们 是 通过 # 来 编写 一 行 的 注释 ， 此 外 ， 还 可 以 用 三 个 单 
引号 (''') 或 三 个 双 引 号 (""") 来 进行 多 行 的 注释 。 下 面 改 写 HelloPython 范例 程序 ， 来 示范 一 
下 缩 进 和 注释 的 具体 用 法 。 
#coding=utf-8 
#Print Hello World 
Print ("Hello World") 


1 到 10 的 累加 和 


1 
#sum = 0 

sum = 0 

9 for i in range(11) : 

10 #sum += i 

生生 sum += i 

12 print (sum) 


在 第 1 行 里 ， 通 过 #coding 的 方式 指定 了 本 程序 的 编码 格式 是 utf8， 在 第 2 行 里 ， 通 过 # 编 写 
了 一 行 注释 。 在 第 4 行 到 第 6 行 里 ， 是 通过 了 '' 来 编写 了 跨行 的 注释 〈 即 多 行 的 注释 ) 。 

请 注意 ， 在 第 11 行 中 ， 通 过 缩 进 来 定义 了 for 循环 语句 的 语句 块 ， 这 里 缩 进 了 4 个 空格 。 在 
Python 语言 中 并 没有 严格 规定 缩 进 多 少 空格 ， 但 要 求 同 一 个 语句 块 层 级 缩 进 的 空格 数 是 一 样 的 ， 
比如 当 我 们 注释 第 11 行 的 代码 ， 同 时 取消 第 10 行 代码 的 注释 〈#) ， 由 于 没有 缩 进 ，Python 解释 
器 就 会 提示 语法 错误 。 按 照 一 般 的 习惯 ，Python 语句 块 以 四 个 空格 一 组 作为 一 个 基本 单位 进行 缩 
进 。 
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同样 ， 如 果 我 们 取消 第 7 行 代码 的 注释 ， 由 于 这 行 代码 没有 同 之 前 的 代码 有 逻辑 上 的 从 属 关 
系 或 层级 关系 ， 所 以 不 该 缩 进 ， 如 果 缩 进 了 也 会 报错 。 而 且 ， 这 里 我 们 缩 进 的 单位 是 4 个 空格 ， 所 
以 之 后 的 缩 进 都 应 该 是 4 个 空格 为 一 组 作为 缩 进 的 基本 单位 , 即 在 同一 种 编码 风格 中 , 相同 层次 语 
句 块 〈 或 代码 段 ) 的 缩 进 空格 数 必须 保持 一 致 


1.2.2 ”定义 基本 数据 类 型 


在 Python 中 ， 定 义 变量 时 不 需要 声明 类 型 可 以 直接 赋值 ， 这 看 上 去 是 好 事 ， 因 为 编程 更 方便 
了 。 其 实 不 然 ， 正 因为 没有 约束 ， 所 以 初学 者 更 不 能 随心 所 欲 地 使 用 ， 和 否则 会 让 程序 代码 的 可 读 性 
变 得 很 差 。 在 下 面 的 PythonDataDemo.py 程序 中 ， 我 们 来 看 下 基本 数据 类 型 的 用 法 。 
# coding=utf-8 
# 演示 基本 数据 类 型 
age = 12 # 整数 类 型 
# age = 15.5 错误 的 用 法 
print (age) # 打印 12 
Price = 69.8 # 浮 点 型 
print (price) # 打印 69.8 
#distance = 20L # 长 整 型 ， 仅 限 Python2 
9 #print(distance) # 打印 20 
10 isMarried = True # 布尔 类 型 
11 Print(isMarried) # 打印 True 
12 msg = "Hello"  # 字符 串 
13 print (msg) # Hello 


通过 注释 可 以 很 清晰 地 看 到 ， 从 第 3 行 到 第 13 行 的 程序 语句 定义 并 输出 了 各 种 类 型 的 数据 。 
语法 非常 简单 ， 但 请 大 家 注意 两 点 。 

(1) 由 于 在 定义 变量 前 ， 没 有 像 Java 或 其 他 程序 设计 语言 那样 ， 通 过 int、long、string 等 关 
键 字 显 式 地 定义 数据 类 型 ， 因 此 变量 名 应 该 尽量 通俗 易 懂 ， 让 其 他 人 一 看 就 能 知道 变量 的 含义 ， 而 
少 用 i,j 之 类 的 不 含 实际 意义 的 单个 字母 。 

(2) 如 果 取 消 第 4 行 的 注释 ， 代 码 也 能 运行 ， 这 时 第 5 行 就 会 输出 15.5。 这 种 做 法 其 实 改变 
了 age 变量 的 数据 类 型 这样 随意 改变 变量 类 型 的 做 法 不 仅 会 增加 代码 的 维护 难度 ,更 会 在 使 用 时 
造成 很 大 的 混淆 ， 所 以 在 定义 和 使 用 变量 时 ， 不 要 轻易 地 变动 变量 的 类 型 。 
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1.2.3 ”字符 串 的 常见 用 法 


在 1.2.2 小 节 的 样 例 代码 中 ， 我 们 是 通过 双 引 号 定义 了 一 个 字符 串 。 下 面 通 过 范例 程序 
PythonStrDemo.py 来 演示 字符 串 的 基本 用 法 。 


和 # !/usr/bin/env python 

be # coding=utf-8 

3 str = 'My String' 

4 printl(str) # 输出 完整 字符 串 

5 print(str[0]) # 输出 第 1 个 字符 M 
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print (str[3:9]) # 输出 第 3 至 第 9 个 字符 串 ， 即 String 
print (str[3:]) # 输出 第 3 至 最 后 的 字符 串 ， 也 是 String 
print (str * 2) # 输出 字符 串 2 次 ， 但 这 种 写法 不 常用 
Print("He"+"1lo")  # 字符 串 连 接 ， 输 出 Hello 
比 起 之 前 的 代码 ， 在 本 范例 程序 的 第 1 行 指 定 了 执行 Python 的 命令 。 
在 Windows 的 MyEclipse 中 ， 是 通过 “Run As” 的 方式 运行 Python 代码 ， 但 如 果 这 段 程序 放 
入 到 Linux 等 其 他 操作 系统 中 ， 就 需要 指定 执行 这 段 代 码 的 Python 命令 ， 这 里 通过 /usr/bin/env 目 
录 下 的 “python” 命 令 执行 本 Python 脚本 程序 。 

在 第 3 行 中 定义 了 一 个 字符 串 〈 注 意 这 里 用 的 是 一 对 单 引 号 ， 在 Python 语言 中 ， 成 对 的 单 引 
号 和 成 对 的 双 引 号 都 可 以 用 来 定义 字符 串 常量 ) ， 随 后 在 第 4 行 到 第 9 行 中 ,以 各 种 方式 输出 了 字 
符 串 。 请 注意 ,在 第 5 行 到 第 7 行 中 ， 用 到 了 字符 串 的 下 标 (或 称 为 索引 ) ， 而 下 标 值 是 从 0 开始 
的 。 在 第 9 行 中 是 通过 “+” 运 算 符 拼 接 了 字符 串 。 
此 外 ，Python 还 提供 了 查找 替换 等 字符 串 操作 的 方法 ， 在 下 面 的 PythonStrMore.py 范例 程序 


wo 


print ("Hello: \name is Peter." ) # \n 是 换行 符 

print (r"Hello \name is Peter."” ) # 加 了 前 级 r， 则 会 原样 输出 
str = "123456789" 

print (str.index("234")) ， 查找 234 这 个 字符 串 的 位 置 ， 返回 1 
10 #print (str.index("256"))  # 没 找到 则 会 抛 出 异常 

11 print (str.find("456")) # 查找 456 所 在 的 位 置 ， 返 回 3 

12 print (str.find("256")) # 没 找 到 ， 返 回 -1 

13 print (len(str) ) # 返回 长 度 ， 结 果 是 9 

14 print (str.replace("234"，"334")) # 把 234 替换 成 334 


前 面 讲 过 ， 在 Python 语言 中 ， 可 以 通过 单 引号 定义 字符 串 ， 在 上 述 第 4 行 和 第 5 行 中 的 代码 
里 ， 演 示 了 两 种 符号 混合 使 用 的 效果 。 对 此 的 建议 是 ， 在 同一 个 Python 项 目 中 ， 如 果 没 有 特殊 的 
需要 ， 最 好 用 统一 的 风格 来 定义 字符 串 ， 比 如 都 用 单 引号 或 都 用 双 引 号 。 如 果 确 有 必要 混合 使 用 ， 
那么 需要 通过 注释 来 说 明 。 

在 第 6 行 中 ， 是 输出 “Hello \name is Peter.” 这 个 字符 串 ， 但 由 于 是 换行 符 ， 因 此 中 间 会 换 
行 ， 输 出 效果 如 下 所 示 。 因 为 “\” 是 转 义 字符 ， 如 果 不 想 转 义 ， 则 可 以 像 第 7 行 那样 ， 在 字符 串 
之 前 加 r。 

1 ‘Hello: 
2 ame is Peter. 

从 第 9 行 到 第 12 行 的 程序 语句 分 别 通 过 index 和 find 来 查找 字符 串 , 它 们 的 差别 是 ,通过 index 
方法 如 果 没 找到 ， 则 会 抛 出 异常 ， 而 find 则 会 返回 -1。 这 两 种 方法 的 相同 点 是 : 如 果 找 到 ， 则 返回 
目标 字符 串 的 下 标 〈 或 索引 ) 位 置 。 

在 第 13 行 和 第 14 行 的 程序 语句 中 ， 演 示 了 计算 字符 串 长 度 和 字符 串 蔡 换 的 方法 ， 上 述 代码 


中 ， 可 以 看 到 平时 项 目 中 针对 字符 串 的 常见 用 法 。 
1 # !/usr/bin/env Python 

包 # coding=utf-8 

3 

4 Print("Hello 'World'") # 双 引 号 单 引号 夹杂 使 用 
5 print ('Hello "World"') # 单 引号 里 套 双 引 号 

6 

7 

8 

9 
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同样 是 通过 注释 给 出 了 运行 结果 ， 读 者 可 以 自己 运行 ， 并 在 控制 台中 对 比 一 下 运行 结果 。 


1.2.4 ”定义 函数 与 调用 函数 


为 了 提升 代码 的 可 读 性 和 维护 性 ， 需 要 把 调用 次 数 比较 多 的 代码 块 封装 到 函数 中 。 函 数 
(Function) 在 面向 对 象 的 程序 设计 中 也 叫 方法 (Method) ， 在 Python 语言 中 ， 可 以 通过 def 来 定 
义 函 数 或 方法 ， 并 且 在 函数 名 或 方法 名 之 后 加 冒号 。 

在 下 面 的 PythonFuncDemo.py 范例 程序 中 ， 演 示 了 定义 和 调用 带 有 返回 值 和 不 带 返 回 值 函数 
的 两 种 方式 。 


# !/usr/bin/env Python 

# coding=utf-8 

# 定义 没 返 回 的 函数 

def printMsg (x,y): 
Print ("x is %d™ %x) 
Peoe A Ee So YN 

# 通过 return 返回 

def add (x,y): 

9 return x+y 
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11 # 调用 函数 
12 printMsg(1,2) 
13 # printMsg ("1",2)  # 报错 ， 这 就 是 不 注意 参数 类 型 的 后 果 
14 Print (add(100,50)) 

在 第 4 行 到 第 6 行 的 代码 中 ， 通 过 def 定义 了 printMsg 函数 ， 它 有 两 个 参数 。 在 Python 语言 
中 , 没有 像 其 他 程序 设计 语言 那样 通过 大 括号 的 方式 来 定义 函数 体 , 而 是 通过 像 第 5 行 和 第 6 行 的 
缩 进 方式 来 定义 函数 体内 部 的 语句 块 。 在 这 个 函数 内 部 的 print 语句 中 ,通过 %d、%x 和 %y 方式 来 
输出 参数 传 入 的 x 和 y 这 两 个 值 。 

在 第 8 行 和 第 9 行 的 add 函数 中 ， 同 样 是 通过 缩 进 定义 了 函数 的 层次 结构 ， 其 中 使 用 了 return 
语句 来 返回 函数 内 部 的 计算 结果 。 

定义 好 函数 之 后 ， 上 面 的 范例 程序 中 分 别 在 第 12 行 和 第 14 行 调用 了 printMsg 和 add 这 两 个 
函数 。 这 个 范例 程序 的 输出 结果 如 下 所 示 ， 其 中 前 两 行 是 printMsg 函数 的 输出 ， 第 3 行 是 add 函 
数 的 输出 。 

| 

和 

150 

由 于 在 定义 Python 变量 时 ,无 法 通过 像 其 他 程序 设计 语言 那样 用 int 等 变量 数据 类 型 声明 的 方 
式 来 指定 变量 的 数据 类 型 ， 因 此 在 使 用 变量 时 尤其 要 注意 ， 如 果 像 第 13 行 那样 ， 调 用 函数 时 本 来 
要 传 入 整 型 参数 ， 但 却 传 入 了 字符 串 类 型 的 参数 ， 结 果 就 会 报错 。 
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1.3 ”控制 条 件 分 支 与 循环 调用 


和 其 他 程序 设计 语言 一 样 ，if...else 条 件 分 支 语句 和 诸如 for 与 while 等 的 循环 语句 在 Python 
项 目 开发 时 也 是 不 可 或 缺 的 ， 由 于 Python 不 用 “{f}” 来 定义 语句 块 ， 因 此 在 条 件 分 支 和 循环 语句 
中 ， 也 得 用 缩 进 来 表示 语句 块 的 逻辑 层次 结构 。 

可 以 这 样 说 ， 结 合 前 文 提 到 的 函数 调用 流程 ， 再 加 上 条 件 分 支 语句 和 循环 语句 ， 那 么 就 能 了 
解 Python 程序 的 大 致 结构 ， 也 就 是 说 ， 学 好 这 部 分 内 容 后 ， 就 能 达到 Python 语言 的 入 门 标准 了 。 


1.3.1 通过 if...else 控制 程序 的 分 支流 程 


Python 的 条 件 分 支 语句 的 语法 如 下 ， 其 中 elif 的 含义 是 else if。 


if 条 件 1: 

满足 条 件 1 后 执行 的 代码 
elif 条 件 2 

满足 条 件 1 后 执行 的 代码 
else 


没有 满足 上 述 条 件 时 执行 的 代码 
下 面 通过 一 个 判断 关 年 的 PythonIfDemo.py 范例 程序 来 示范 一 下 让 条 件 分 支 语句 的 用 法 。 


# !/usr/bin/env Python 
# coding=utf-8 


ww wN 


# 判断 关 年 
Year=2018 


# year=2020 
if (yeargs4 == 0) and (year%100 != 0): 
print ("%d 是 闽 年 " syear) 
9 elif year%400 == 0: 
10 print ("%d 是 闽 年 " syear) 
11 else: 
12 Print ("%d 不 是 头 年 " syear) 
判断 头 年 的 方法 之 一 是 : 年 份 能 被 4 整除 ， 但 不 能 被 100 整除 ， 如 第 7 行 所 示 ; 方法 之 二 是 ， 
能 被 400 整除 , 如 第 9 行 的 第 二 个 判断 条 件 。 即 满足 这 两 个 方法 之 一 的 年 份 就 是 半年 , 否则 就 不 是 。 
由 于 程序 中 year 被 赋值 为 2018， 因 此 输出 结果 是 “2018 不 是 头 年 ”。 基 于 这 个 范例 程序 的 运 
行 结果 ， 下 面 归纳 一 下 使 用 让 的 要 点 。 
(1) 注意 缩 进 ， 由 于 第 7 行 、 第 9 行 和 第 11 行 属于 同一 逻辑 层次 ， 因 此 它们 均 没 有 缩 进 ， 
而 它们 附属 的 第 8 行 、 第 10 行 和 第 12 行 的 代码 均 需 要 缩 进 。 
(2) if，elif 和 else 等 描述 条 件 的 语句 均 需 要 用 冒号 结尾 。 
(3) 可 通过 一 来 判断 两 个 值 是 否 相 等 , 在 第 7 行 中 还 用 到 了 and 逻辑 运算 符 ( 即 逻 辑 “ 与 ”) ， 
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表示 两 个 条 件 均 满足 时 ， 整 个 证 条 件 判 断 的 结果 为 True， 此 外 ， 还 可 以 用 or 来 表示 逻辑 “或 ”， 
用 not 来 表示 逻辑 “ 非 ”。 


1.3.2 ”while 循环 与 continue，break 关键 字 


Python 语言 中 的 while 循环 语句 和 其 他 程序 设计 语言 的 while 循环 语句 非常 相似 ， 它 的 主要 结 
构 如 下 。 


while 条 件 
满足 条 件 后 执行 的 语句 


在 实际 应 用 中 ，Python 中 的 while 一 般 会 同 ff 语句 、break 和 continue 关键 字 配 合 使 用 ， 其 中 
continue 表示 结束 本 轮 循环 继续 下 一 轮 循 环 〈 并 没有 跳 离 当前 循环 体 ) ，break 则 表示 跳 离 当前 层 
的 while 循环 体 ( 即 退出 了 break 所 在 的 循环 体 ) 。 下 面 通过 范例 程序 PythonWhileDemo.py 来 演示 
循环 执行 的 效果 。 

# !/usr/bin/env Python 


# coding=utf-8 
# 演示 while 的 用 法 


number = 1 
while number < 10: 

number += 1 

if not number%®2 == 0: # 不 是 双 数 时 则 跳 过 本 轮 循 环 
9 continue 
10 else: 
11 Print( number) # 输出 双 数 2、4、6、8、10 
12 # 以 上 输出 2，4，6, 8,10 这 些 偶数 
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14 number = 1 
15 while True: # 条 件 是 True 表示 一 直 执行 
16 Print (number) # 输出 1 到 5 
17 number = number+1 
18 if number > 5: # 当主 大 于 5 时 跳 离 循环 体 
19 break 
20 # 以 上 输出 1,2,3,4,5 
在 第 6 行 的 while 条 件 判断 表达 式 中 ,设置 的 条 件 是 number 小 于 10， 表 示 满 足 这 个 条 件 才能 
执行 第 7 行 到 第 11 行 的 while 循环 体内 的 程序 语句 。 
从 第 8 行 到 第 11 行 的 代码 中 ， 还 嵌入 了 if...else 语句 ， 这 部 分 代码 的 含义 是 : 如 果 number 
是 偶数 ， 则 执行 第 9 行 的 continue 跳出 本 轮 循环 ， 进 入 下 一 轮 循环 ;否则 就 执行 第 11 行 的 代码 输 
出 number 变量 的 值 。 大 家 注意 ，while 和 让 的 附属 语句 都 用 缩 进来 表示 程序 逻辑 的 层次 关系 。 
在 第 15 行 的 while 语句 中 ， 条 件 为 True， 表 示 一 直 会 执行 这 个 循环 ， 但 是 在 循环 体内 的 第 18 
行 让 语句 判断 number 是 否 大 于 5， 如 果 是 ， 则 执行 第 19 行 的 break 语句 跳 离 整个 while 循环 体 。 
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1.3.3 ”通过 for 循环 来 遍历 对 象 


Python 中 的 for 循环 比较 常见 的 用 途 是 “遍历 对 象 ”， 它 的 语法 结构 如 下 : 


for 变量 in 对 象 : 
for 循环 体内 的 程序 语句 


和 while 一 样 ， 在 for 的 实际 应 用 中 ， 也 经 常会 和 认 continue 和 break 配合 使 用 。 下 面 通 过 
PythonForDemo.py 范例 程序 来 演示 for 的 用 法 。 


9 # !/usr/bin/env python 

加 # coding=utf-8 

3 ， 演示 for 的 用 法 

4 

于 languages = ["Uava"，"Go"，"C++"， "Python"， "C#"] 
6 for tool in languages: 

2 de EOOL m= MO 

8 continue # 不 会 输出 C++ 

9 if tool == "Python": 

10 print ("我 正在 学 Python。") 

11 break 

ke Print (tool) 

13 # 输出 了 Java，Go， 我 正在 学 Python， 没 有 输出 C# 


在 第 5 行 中 ， 定 义 了 名 为 languages 的 字符 串 类 型 的 列表 ， 在 其 中 使 用 了 描述 若干 程序 设计 语 
名称 的 字符 串 。 在 第 6 行 的 for 循环 语句 中 ， 使 用 tool 对 象 ， 通 过 in 关键 字 来 遍历 languages 列 
表 。 

在 for 循环 体内 的 程序 语句 第 7 行 和 第 8 行 中 ， 通 过 if 语句 来 判定 ， 如 果 遍 历 到 列表 中 C++ 
元 素 ， 则 执行 continue 结束 本 轮 for 循环 ， 否 则 继续 for 循环 的 下 一 轮 循环 。 第 9 行 的 让 语句 定义 ， 
如 果 遍 历 到 列表 的 Python 元 素 ， 则 输出 “我 正在 学 Python。”， 而 后 执行 第 11 行 的 break 语句 退 
出 当前 for 循环 体 。 

本 段 范 例 程序 的 输出 结果 如 第 13 行 所 说 明 的 注释 ， 由 于 第 8 行 的 continue 语句 ， 因 此 不 会 输 
出 C++， 另 外 由 于 遍历 到 列表 中 的 Python 元 素 时 ， 会 执行 第 11 行 的 break 语句 退出 当前 的 for 循 
环 体 ， 因 此 不 会 输出 C#。 


1.4 通过 范例 程序 加 深 对 Python 语法 的 认识 


在 本 节 中 ， 我 们 将 综合 运用 之 前 学 到 的 函数 、 条 件 分 支 语句 和 循环 语句 来 实现 若干 范例 程序 。 
在 编号、 调试 、 执 行 范例 程序 的 过 程 中 ， 也 需要 调试 (Debug) 代码 中 的 问题 ， 本 节 也 会 介绍 调试 
代码 的 相关 技巧 。 
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1.4.1 ”实现 冒 泡 排 序 算法 


冒 泡 排序 算法 的 执行 步骤 是 , 每 次 比较 两 个 相 邻 的 元 素 , 如 果 它 们 次 序 有 误 ， 则 交换 位 置 。 基 
于 Python 语言 实现 的 冒 泡 排序 范例 程序 如 下 : 


浊 # !/usr/bin/env Python 

于 # coding=utf-8 

3 

4 ”# 定义 冒 泡 排序 的 函数 

多 def SortFunc (numArray): 

6 loopTimes = 0; # 记录 循环 冒 泡 比 较 的 次 数 

ey while loopTimes< len (numRrray)-1: 

8 # index 为 待 比较 元 素 的 下 标 

9 for index in range (len (numArray)-loopTimes-1): 
10 if numArray[index] > numArray[index+1]: 
11 tmp = numArray[index] 

和 numArray[index] = numArray[index+1] 
让 numArray[index+1] = tmp 

14 loopTimes=loopTimes+1 

15 return numArray 

16 


17 unSortedNums = [10,12,48,7,5,3] 
18 Print(SortFunc (unSortedNums) ) 

从 第 5 行 到 第 15 的 程序 代码 中 ， 使 用 def 定义 了 实现 冒 泡 算法 的 SortFunc 函数 ， 在 其 中 是 通 
过 两 层 循环 来 实现 排序 过 程 中 的 交换 操作 。 

在 第 7 行 的 while 循环 条 件 中 设置 了 循环 比较 的 次 数 ， 由 于 是 待 比较 元 素 之 问 的 比较 ， 因 此 循 
环 次 数 是 待 比较 列表 的 长 度 减 1。 在 第 10 行 对 比 了 相 邻 的 两 个 元 素 ， 如 果 与 目标 的 顺序 不 一 致 ， 
则 通过 第 11 行 到 第 13 行 的 代码 交换 两 个 元 素 的 位 置 。 

在 第 17 行 中 ， 定 义 了 一 个 未 经 排序 的 列表 ， 在 第 18 行 中 调用 了 SortFunc 函数 ， 并 在 这 行 中 
通过 print 语句 输出 了 排序 后 的 结果 。 


1.4.2 ”计算 指定 范围 内 的 质数 


质数 是 只 能 被 1 和 自身 整除 的 自然 数 ， 在 如 下 的 PythonCalPrime.py 范例 程序 中 ， 将 使 用 两 层 
嵌 套 的 for 循环 来 寻找 并 打印 指定 范围 内 的 质数 。 


# !/usr/bin/env Python 
# coding=utf-8 
# 打印 质数 的 方法 
def PrintPrime (maxNum) : 
num=[]; 
currentNum=2 
for currentNum in range (2,maxNum+1) : 
devidedNum=2 


oamwm 必 swN 
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9 for devidedNum in range(2,currentNum+1): 

10 if(currentNum%$devidedNum==0): 

1 break 

12 if currentNum == devidedNum: 

13 num.append (currentNum) # 把 质数 加 入 到 列表 里 
14 #print (num) 

I print (num) 

16 


17 PrintPrime (101) 


在 第 4 行 的 printPrime 方法 (或 称 为 函数 ) 的 定义 中 ， 通 过 参数 maxNum 来 指定 待 打 印 质数 
的 上 限 。 在 第 7 行 的 外 层 for 循环 中 ， 通 过 调用 range 方法 ， 依 次 遍历 2 到 maxNum 范围 内 的 自然 
数 , 这 里 请 注意 , 如 果 把 外 层 条 件 写成 “for currentNum in range(2,maxNum+):”, 则 无 法 遍历 maxNum 
这 个 数 。 

在 执行 外 层 循环 时 ， 第 9 行 的 内 层 for 循环 会 依次 让 currentNum 除 以 从 2 到 该 数 本 身 的 各 个 
自然 数 ， 请 注意 ， 这 里 第 9 行 的 写法 依然 是 需要 加 1， 即 “range(2, currentNum+1)”。 

在 执行 内 层 循环 时 ， 如 果 通 过 第 10 行 的 判断 ， 发 现 从 1 到 该 数 本 身 之 外 还 存在 其 他 被 整除 的 
因数 ， 则 说 明 该 数 不 是 质数 ， 那 么 就 执行 第 11 行 的 break 语句 退出 内 层 for 循环 。 如果 内 层 循环 完 
成 后 ， 且 满足 第 12 行 的 让 条件 ， 则 说 明 这 个 数 只 有 1 和 本 身 的 因数 ， 于 是 执行 第 13 行 的 语句 把 
该 数 加 入 到 num 列表 中 num 就 是 存储 已 找到 质数 的 列表 ) 。 

第 17 行 调用 printPrime 函数 ， 执 行 的 结果 就 能 打印 出 101( 含 101) 内 所 有 的 质数 。 这 里 请 注 
意 ， 由 于 Python 是 通过 缩 进 来 判断 程序 语句 块 的 层次 ， 如果 用 错 了 缩 进 格式 ， 比 如 把 第 15 行 的 程 
序 代码 再 缩 进 了 4 个 空格 (如 第 14 行 那样 ， 即 和 第 14 行 语句 起 始 对 齐 ) ， 那 么 就 会 在 每 次 外 层 循 
环 的 最 后 都 打印 出 num 中 的 内 容 ， 其 实 就 是 把 执行 的 中 间 结 果 打 印 出 来 了 。 


1.4.3 ”通过 Debug 调试 代码 中 的 问题 


在 编写 代码 时 ， 一 旦 出 现 了 问题 ， 就 需要 通过 Debug 方法 来 调试 、 排 错 和 修改 有 问题 的 程序 
语句 。 

以 1.4.2 小 节 的 PythonCalPrime.py 范例 程序 为 例 , 如 果 我 们 错误 地 把 第 9 行 的 代码 写成 如 下 的 
样子 ， 即 在 range 中 ， 没 有 对 currentNum 加 1。 

for devidedNum in range (2, currentNum) : 

这 时 输出 的 结果 只 有 2， 明 显 和 我 们 预期 的 不 一 致 ， 此 时 ， 就 可 以 通过 如 下 的 步骤 来 排查 程序 
中 的 问题 。 

人 EXOi) 在 代码 的 左边 , 用 鼠标 双击 加 入 断 点 , 如 图 1-10 所 示 。 该 程序 用 了 两 层 嵌 套 for 循环 ， 
为 了 调试 方便 ， 可 以 把 断 点 设置 在 外 层 for 语句 代码 的 位 置 。 
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de 三 


rintPrime (maxNum) : 


if (cu 
b 


ak 


append (currentNum) 


BEEBEBESY 


Print (num) 


printPrime (101) 


n range (2,maxNum+1): 


for devidedNum in range(2,currentNum+i): 
rentNumsdevidedNum==0): 


ntNum == devidedNum: 


1-10 ”调试 时 在 程序 代码 里 加 入 断 点 
C302 在 代码 的 空白 位 置 , 单 击 鼠标 右键 ， 在 弹出 的 快捷 菜单 中 ， 依 次 单 击 “Debug As” 一 


“Python Run"， 以 Debug 的 方式 运行 程序 ， 如 图 1-11 所 示 。 


国 pyhonCalprime X 


def PrintPrime (maxium) : 


国 cqy Context qualified Ine 


SHift Right 
Slift Left 


printErime (101) Brofile hs 


Bn hs 
Capsre Tith 
Replace With 


Eeste Ctrlty 


kick Fix Cirltl 


Shor In 如 ttShiftty » 


* 2 Python wit-test 
» 


») Debue Configurations 


1-11 ”以 Debug 的 方式 运行 程序 


CW03 以 Debug 方式 启动 程序 的 运行 后 ， 光 标 会 停 在 之 前 设置 的 断 点 位 置 ， 如 果 此 时 单 击 


0G 


“Step Over” 按 钮 ( 快捷 键 为 【 F6 】)， 光 标 则 会 依次 跳 到 下 一 条 语句 上 ， 如 果 此 时 把 鼠标 移动 到 


currentNum 等 变量 上 ， 就 能 看 到 这 个 变量 当前 的 值 ， 如 图 1-12 所 示 。 


本 pythonCalprime x 


Sdef printPrime (maxNum) : 
num=[]; 


currentNum=2 


num. append (currentNum) 


Print (num) 


printPrime (101) 


int: 3 


lint Found at: PrthonCalPrine| 


|eurrentlu 


2 for currentNum In range (2,maxNum+1): 

® devidedNum=2 

给 for devidedNum in range (2,currentNum): 
[3 if (currentNumtdevidedNum==0): 

@ break 

[3 if currentNum == devidedNum: 

®@ 

® 


图 1-12 调试 程序 时 查看 变量 当前 值 的 效果 图 
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当 currentNum 是 3 的 时 候 ， 我 们 编写 这 句 程序 语句 的 本 意 是 让 devidedNum 依次 遍历 2 和 3 
这 两 个 数 ， 这 样 在 退出 内 层 for 循环 ， 执 行 让 语句 时 ，currentNum 等 于 devidedNum， 结 果 就 能 判 
定 3 是 质数 。 

但 是 ， 通 过 “ 单 步 执行 ”调试 时 ， 我 们 看 到 此 时 当 devidedNum 取 值 为 3 时 ， 并 没有 执行 内 层 
循环 的 “这 currentNum%devidedNum 一 0):” 语 句 ， 而 是 直接 退出 了 内 层 循环 ， 由 此 我 们 就 发 现 了 问 
题 ， 原 来 是 设置 内 层 for 循环 条 件 时 ，range 变量 的 第 二 个 参数 设置 得 不 对 。 于 是 改 成 如 下 的 

“currentNum+1” 后 再 运行 ， 结 果 就 正确 了 。 


for devidedNum in range(2,currentNum+1) 


在 开发 Python 应 用 程序 时 ， 读 者 或 许 用 的 是 其 他 的 开发 环境 。 虽 然 在 不 同 的 开发 环境 中 ， 代 
码 调试 的 具体 步 又 可 能 不 同 ,但 通过 代码 调试 排查 问题 的 思路 都 是 通用 的 。 一 般 来 说 , 通过 如 下 三 
个 调试 的 步骤 ， 能 发 现 程序 中 的 绝 大 多 数 问题 。 

人 6i 在 合适 的 位 置 加 上 断 点 , 如果 不知 道 问题 所 在 ， 就 从 程序 的 开始 位 置 加 上 断 点 ， 待 确 
认 问 题 范围 后 再 不 断 地 添加 或 去 掉 断 点 。 

CT02 可 以 通过 单 步 执行 ,查看 具体 场景 里 每 个 变量 的 值 ， 也 可 以 通过 不 断 地 “ 单 步 执 行 ”， 
观察 程序 运行 的 顺序 是 否 和 我 们 预期 的 一 样 。 

703 还 可 以 通过 “Step Into” 的 方式 ， 进 入 到 具体 函数 内 部 排查 问题 ,如 图 1-13 所 示 , 把 
断 点 设置 在 printPrime 函数 上 ， 以 Debug 方式 启动 程序 后 ， 再 单 击 “Step Into” 菜 单 选项 ， 就 会 进 
入 到 这 个 函数 的 第 1 行 ， 如 图 1-14 所 示 。 


B pythonCalprime x 


3 def printPrime (maxNum) : 


Num == devidedNum: 
ppend (cuzzencNum) 


E33 


Print (num) 


车 


brintPrime (101) 
ound at: PrthonCalPri 


图 1-13 在 函数 上 加 断 点 


Sdef printPrime (maxNum) : 
num=[]; 


n range (2,maxNum+1): 


图 1-14 通过 Step Into 进入 函数 内 部 调试 


第 1 章 掌握 实用 的 Python 语法 | 17 


1.5 本 章 小 结 


在 本 章 里 ， 我 们 没有 华而不实 地 讲述 Python 语言 的 特点 以 及 发 展 过 程 ， 而 是 开门 见 山地 搭建 
Python 开发 环境 ， 不 但 讲述 了 Python 中 常用 的 语句 和 语法 ， 而 且 还 通过 了 若干 范例 程序 让 大 家 加 
深 了 对 基本 语句 和 语法 的 认识 。 

本 章 还 简单 介绍 了 通过 代码 调试 排查 程序 中 问题 的 方法 ， 一 般 来 说 ， 高 级 程序 员 和 初级 程序 
员 之 间 很 重要 的 一 个 方面 就 是 能 否 会 通过 调试 方法 发 现 并 修改 问题 ,所 以 强烈 建议 读者 在 读 完 本 部 
分 内 容 后 ， 尽 快 通过 实践 ， 熟 悉 并 掌握 代码 调试 的 相关 技巧 。 


第 2 


Python 中 的 数据 结构 : 集合 对 象 


在 实际 的 项 目 中 ， 需 要 用 到 各 种 类 型 的 对 象 类 存储 数据 ， 比 如 用 列表 来 存储 收集 到 的 股票 指 
数 信息 ， 用 键 - 值 对 (Key-Value Pair) 的 方式 来 关联 “每 个 账户 及 所 对 应 的 股票 列表 ”， 我 们 把 这 
种 数据 的 存储 和 组 织 方式 ， 叫 作 “ 数 据 结 构 ”。 

数据 存储 是 数据 分 析 和 展示 的 基础 ， 在 实际 的 编程 过 程 中 ， 我 们 不 仅 会 用 到 各 种 数据 结构 ， 
还 会 频繁 操作 数据 结构 中 的 各 种 数据 。 在 本 章 中 , 将 会 基于 程序 项 目的 实际 用 途 来 讲解 列表 、 元 组 、 
字典 和 映射 等 类 型 的 数据 结构 以 及 它们 的 用 法 。 


2.1 ”列表 和 元 组 能 存储 线性 表 型 数据 


在 用 Java 语言 学 数据 结构 时 ， 会 了 解 到 这 样 的 知识 : 第 一 ， 数 组 和 链表 是 不 同 数据 结构 的 对 
象 ; 第 二 ， 在 数组 中 ， 查 找 特定 索引 位 置 元 素 的 效率 比 链 表 快 ， 但 插入 和 删除 元 素 的 效率 却 没 链表 
高 。 不 过 ， 这 和 Python 语言 中 定义 线性 表 的 方式 不 同 ， 所 以 上 述 知 识 点 无 法 应 用 在 Python 中 。 

在 Python 语言 中 ， 数 组 是 个 统称 ， 它 有 三 种 类 型 : 第 一 类 是 链表 型 ， 在 其 中 可 以 动态 添加 和 
删除 数据 ， 本 书 中 称 此 类 型 为 列表 (List) ;第 二 类 是 元 组 型 (Tuple) ， 一 旦 定义 后 ， 其 中 的 元 素 
不 能 被 修改 ; 第 三 类 是 字典 型 (Dictionary)， 在 这 类 数组 中 能 存储 若干 个 键 - 值 对 (Key-Value Pair) 
类 型 的 数据 。 


2.1.1 列表 的 常见 用 法 


列表 是 Python 中 常见 的 集合 类 数据 结构 ， 在 下 面 的 ListDemo.py 范例 程序 中 演示 了 Python 数 
组 的 常见 用 法 ， 需 要 注意 的 是 : 尽量 不 要 在 其 中 存储 不 同类 型 的 数据 。 
汪 # !/usr/bin/env Python 
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# coding=utf-8 

3 ”# 定义 多 个 类 型 的 列表 

4 priceList = [10.58,25.47,100.58]  ”# 浮 点 型 列表 

5 cityList = ["ShangHai"，"Hangzhou"，"NandJing"] # 字符 串 类 型 列表 
6 mixList = [1, 3.14, "Company"] # 混合 类 型 的 列表 ， 谨 慎 使 用 

- 

8 


# 在 控制 台 输出 
9 Print (PriceList) #[10.58; 25.47, 100.58] 
10 print(cityList) #['ShangHai', 'HangZhou', 'NanJing'] 
11 print (mixList) #[1, 3.14, 'Company'] 
2 


13 del mixList[2] 
14 print (mixList) # 没有 了 最 后 一 个 元 素 
15 # mixArr.remove(2) # 去 掉 没有 的 元 素 ， 也 会 抛 出 异常 


16 mixList.remove (1) 


17 print (mixList) # 也 看 不 到 1 了 

18 

19 print (PriceList[0]) # 获得 数组 指定 位 置 的 元 素 ， 这 里 输出 是 10.58 
20 priceList.append(200.74) ”# 添加 元 素 

21 Pprint(priceList) # 能 看 到 添加 后 的 元 素 


22 print(cityList.index("ShangHai")); 
23 #print (cityList.index ("DaLian")); # 如 果 找 不 到 ， 会 抛 出 异常 并 终止 程序 

在 上 述 范例 程序 代码 中 ， 演 示 了 针对 列表 的 常见 用 法 ， 通 过 注释 可 以 知道 关键 代码 的 含义 ， 
而 且 在 各 个 输出 语句 的 位 置 也 通过 注释 说 明了 输出 的 结果 。 这 里 ， 请 读者 注意 如 下 的 要 点 。 

(1) 在 定义 列表 时 ， 如 果 没 有 特殊 的 需求 ， 请 不 要 像 第 6 行 那样 ， 在 列表 中 定义 了 不 同类 型 
的 数据 ， 因 为 在 处 理 时 不 得 不 先 判断 数据 的 类 型 再 进行 针对 性 的 读 取 ， 这 样 会 增加 代码 的 复杂 度 ， 
非常 不 利于 程序 的 维护 。 

(2) 可 以 通过 del 和 remove 来 删除 元 素 ， 但 在 使 用 remove 删除 元 素 时 ， 需 要 保证 该 元 素 存 
在 ， 否 则 就 会 抛 出 异常 ， 从 而 导致 程序 异常 中 止 。 如 果 去 掉 第 15 行 的 注释 符号 ， 就 能 看 到 因 删 除 
不 存在 元 素 而 导致 抛 出 异常 的 结果 。 如 果 希 望 在 删除 不 存在 元 素 时 不 抛 出 异常 ， 那 么 可 以 调用 
discard 方法 。 

(3) 可 以 像 第 19 行 那样 ， 通 过 诸如 priceList[0] 的 形式 ， 以 索引 的 方式 操作 其 中 的 具体 元 素 ， 
这 里 请 注意 ， 元 素 的 索引 值 是 从 0 开始 ，priceArr[0] 表 示 的 是 列表 中 的 第 一 个 元 素 。 

(4) 可 以 像 第 22 行 那样 ， 用 index 的 方式 在 数组 里 查找 元 素 ， 如 果 找到 ， 返 回 的 是 该 元 素 的 
索引 位 置 ， 同 样 请 注意 ， 如 果 去 掉 第 23 行 的 注释 符号 ， 去 找 一 个 不 存在 的 元 素 ， 就 会 抛 出 异常 而 
导致 程序 意外 中 止 。 


在 实际 的 程序 项 目 中 ， 如 果 出 现 异 常 ， 我 们 期 望 的 结果 是 ， 看 到 错误 提示 ， 同 时 程序 继续 执 
行 。 不 过 ,在 这 个 范例 程序 中 ， 我 们 看 到 的 是 “ 抛 出 异常 ， 程 序 意外 中 止 ”的 结果 ， 这 种 中 止 程序 
执行 的 做 法 是 比较 危险 的 , 所 以 在 本 书 的 后 续 部 分 , 会 通过 “异常 处 理 机 制 ” 来 专门 解决 这 类 问题 。 
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2.1.2 链表、 列表 还 是 数组 ? 这 仅仅 是 叫 法 的 不 同 


在 2.1.1 小 节 提 到 ， 链 表 类 数组 是 数组 类 型 的 一 种 ， 所 以 在 上 一 节 范例 程序 中 定义 的 priceArr 
对 象 ， 称 它 为 链表 (有 人 也 称 它 列表 ) 和 数组 ， 都 不 算 错 。 事 实 上 ，Python 由 于 是 弱 数据 类 型 的 
语言 ， 即 定义 元 素 时 无 需 定义 数据 类 型 ， 因 此 从 使 用 方式 上 来 看 ， 列 表 (List) 和 数组 (Array) 的 
差别 确实 不 大 。 

如 果 大 家 熟悉 数据 结构 的 知识 ,就 会 发 现 列表 和 数据 在 底层 的 实现 是 不 同 的 , 这 在 Java 或 C# 
等 强 数据 类 型 〈 即 定义 元 素 必 须要 给 出 数据 类 型 ) 的 语言 中 确实 会 是 个 问题 ， 但 在 Python 语言 中 
则 不 是 。 

通过 Python 语言 给 出 的 接口 ， 我 们 可 以 用 同一 种 方式 来 操作 列表 和 数组 ， 无 需 也 无 从 选择 ， 
不 能 像 Java 等 语言 一 样 ， 在 定义 时 必须 强制 指定 是 数组 还 是 列表 。 

既然 无 从 选择 ， 那 么 可 以 这 样 说 ， 在 Python 中 ， 数 组 和 列表 其 实 是 相通 的 ， 也 就 是 用 起 来 一 
样 ， 但 为 了 不 让 大 家 混淆 ,本 书 会 把 列表 型 的 数组 也 称 为 “列表 ”， 而 尽量 不 出 现 “ 数 组 ”的 字样 。 


2.1.3 ”对 列表 中 元 素 进行 操作 的 方法 


在 常见 的 数据 分 析 和 统计 场景 中 使 用 列表 ， 可 以 调用 Python 提供 的 诸如 排序 和 求 最 大 值 等 操 
作 列 表 中 元 素 的 方法 。 在 下 面 的 ListSeniorUsage.py 范例 程序 中 ， 可 以 看 到 操作 列表 中 数据 的 常用 
方法 。 
1 # !/usr/bin/env Python 

# coding=utf-8 


有 
3 
4 priceList = [10.58,25.47,100.58,500.47] 

5 cityList = ["ShangHai", "HangZhou", "NanJing"] 
6 ”# 进行 排序 

7 priceList.sort() 

8 print(priceList); 

9 # print (priceList.sort()); # 错误 的 用 法 


10 

11 print(sum(priceList)) # 求 和 

12 print (max (priceList)) # 求 最 大 值 ， 输 出 500 .47 
13 print(min(cityList)) # 求 最 小 值 ， 输 出 Hangzhou 
14 

15 subList = priceList[1:3] ”上 # 截取 列表 中 元 素 

16 print(subList) # 输出 [25.47，100.58] 


在 第 7 行 中 ， 对 priceList 进行 了 排序 ， 如 果 要 输出 排序 后 的 列表 ， 应 该 如 第 8 行 那样 ， 而 不 
能 像 第 9 行 那样 直接 打印 priceList.sort()。 

从 第 11 行 到 第 13 行 的 程序 语句 ， 分 别 执行 了 求 和 ， 求 最 大 值 和 最 小 值 的 操作 。 其 中 第 13 行 
是 对 字符 串 型 列表 中 的 字符 串 求 最 小 值 ， 结 果 是 按 字 母 顺序 排序 字符 串 并 返回 最 小 的 字符 串 。 

第 15 行 的 程序 语句 是 截取 了 列表 中 的 部 分 元 素 ， 请 注意 ， 冒 号 前 的 参数 表示 从 哪个 索引 位 置 
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开始 截取 ， 索 引 值 也 是 从 0 开始 ， 语 句 中 的 1， 表 示 从 第 2 个 元 素 开 始 。 这 里 需 特别 注意 ， 冒 号 后 
的 参数 表示 截取 到 哪个 索引 位 置 ， 这 条 语句 中 是 3， 表 示 截 取 到 列表 的 第 4 个 元 素 之 前 ， 但 不 含 第 
4 个 元 素 〈 不 含 500.47 这 个 元 素 ) 。 


2.1.4 不 能 修改 元 组 内 的 元 素 


在 前 文中 ， 是 通过 方 括号 来 定义 列表 ， 而 元 组 (Tuple) 是 通过 “0” 来 定义 的 。 

元 组 内 的 元 素 不 能 被 修改 ， 具 体 含义 就 是 : 第 一 ， 不 能 修改 和 删除 其 中 的 元 素 ; 第 二 ， 创 建 
好 的 元 组 无 法 再 向 其 中 添加 元 素 。 不 过 ， 可 以 针对 整个 元 组 进行 其 他 操作 。 在 实际 应 用 中 ， 一 般 用 
元 组 来 存储 不 会 变更 的 常量 元 素 。 在 下 面 的 TupleDemo.py 代码 中 演示 了 元 组 的 常见 用 法 。 


和 # !/usr/bin/env python 

2 # coding=utf-8 

3 ”# 定义 两 个 元 组 

4 cityTup = ("TianJin","WuHan","ChengDu") 

5 # cityTup[0] = "HeFei" # 会 抛 出 异常 

6 # del cityTup[0]  ”# 无 法 删除 其 中 的 元 素 则 会 抛 出 异常 

7 print(cityTup) # 输出 结果 是 ('TianJin'，'WuHan'，'ChengDu') 
8 “”# 把 列表 转 为 元 组 


9 bookList = ["Python book","Java Book"] 
10 bookTup = tuple (bookList) 


a 

12 ”# 查询 操作 

13 print(cityTup[1])  # 输出 WuHan 

14 print(cityTup[0:2]) # 输出 ('TianJin'，'WuHan') 
15 


16 ”# 统计 元 组 里 指定 元 素 的 个 数 

17 print(cityTup.count ("TianJin")) # 返回 1 
18 ”# 统计 元 组 的 长 度 

19 print(len(cityTup)) # 返回 3 


21 ”# 只 能 删除 整个 元 组 对 象 
22 del cityTup 

范例 程序 的 第 4 行 通过 小 括号 的 方式 定义 了 一 个 名 为 cityTup 的 元 组 , 第 5 行 的 程序 语句 企图 
修改 这 个 元 组 的 第 1 个 元 素 ， 由 于 元 组 无 法 被 修改 ,因此 会 抛 出 异常 。 第 9 行 的 代码 定义 了 一 个 列 
表 ， 之 后 通过 第 10 行 的 tuple 方法 ， 把 列表 转换 成 了 元 组 ， 这 样 bookTup 也 就 无 法 被 修改 了 。 

在 第 13 和 第 14 行 中 ， 以 两 种 方式 查询 了 元 组 内 的 元 素 ， 请 注意 ， 第 14 行 语句 中 冒号 前 后 的 
两 个 参数 也 是 表示 存 取 的 “开始 位 置 ” 和 “终止 位 置 ”， 截 止 到 终止 位 置 之 前 的 元 素 都 会 输出 ， 但 
终止 位 置 的 元 素 不 会 被 输出 。 

在 第 17 行 中 ， 调 用 count 方法 统计 元 组 内 指定 元 素 出 现 的 次 数 ， 在 第 19 行 中 ， 通 过 调用 len 
方法 打印 输出 元 组 的 长 度 。 虽 然 我 们 无 法 删除 元 组 中 的 单个 元 素 ， 但 却 可 以 通过 调用 del 方法 删除 
整个 元 组 ， 如 第 22 行 那 样 。 
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2.2 ”集合 可 以 去 除 重 复元 素 


Python 语言 中 的 集合 〈Set) 是 无 法 包含 重复 元 素 的 ， 所 以 在 实际 应 用 中 ， 经 常 通过 集合 来 执 
行 去 重 操作 。 此 外 ， 在 数据 分 析 等 应 用 场景 中 ， 还 可 以 使 用 集合 包含 的 各 种 操作 方法 ， 比 如 union 
(并 集 ) 、intersection (交集 ) 和 difference( 差 集 ) 。 


2.2.1 通过 集合 去 掉 重 复 的 元 素 


在 下 面 的 SetRemoveDup.py 范例 程序 中 演示 了 集合 的 常见 用 法 ， 可 以 从 中 看 到 集合 具有 自动 
去 掉 重 复元 素 的 功能 。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 ”# 调用 集合 的 方法 把 列表 转换 成 集合 

4 gotl = setll"a"y "a "Dey "bny "ol]) 

5 print(set1) # 输出 set(['a',，'c'，'b']) 

6 “”# 添加 元 素 

7 setl.add("d") 

8 setl.add("c") # 由 于 重复 ， 因 此 无 法 添加 

9 print(setl1) esett ar wor "Due ol 


11 set2 = setl.copy() 
12 setl.clear() 
13 print(set1) # 由 于 已 清空 ， 因 此 输出 set ([]) 


14 print(set2) eoGthuan vou VD. An 

15 

16 set2.discard("f") # 删除 元 素 ， 哪 怕 没 找到 也 不 会 抛 出 异常 

18 list=[1,1,2,2,3,3,4,4,5] ”<# 含 重 复元 素 的 列表 

19 setFromList=set (list) # 通过 集合 去 掉 重复 的 元 素 

20 print(setFromList) # 输出 为 set([1，2，3，4，5]) 


在 第 4 行 中 通过 调用 set 方法 ， 把 一 组 包含 重复 字母 的 列表 转换 成 集合 元 素 ， 从 第 5 行 的 打印 
语句 可 知 ， 在 setl 中 ， 已 经 没有 重复 元 素 了 ， 由 此 能 体会 到 集合 的 去 除 重复 元 素 的 特性 。 

在 第 7 行 和 第 8 行 中 ， 调 用 add 方法 向 setl 中 添加 元 素 ， 由 于 已 经 有 了 c 这 个 字母 ， 因 此 无 
法 再 插入 重复 的 元 素 。 在 第 11 行 和 第 12 行 中 ， 可 以 看 到 常用 于 集合 的 copy 和 clear 方法 。 

在 第 16 行 中 ， 调 用 discard 方法 来 去 掉 集 合 中 的 元 素 ， 该 方法 也 适用 于 列表 〈List) 。 与 之 前 
提 到 的 remove 方法 不 同 ， 调 用 这 个 方法 删除 元 素 时 ， 哪 怕 元 素 不 存在 ， 也 不 会 抛 出 异常 。 
在 第 18 行 和 第 19 行 中 演示 了 集合 的 常规 做 法 ， 即 去 掉 列表 中 的 重复 元 素 。 和 第 4 行程 序 语 
句 去 重复 功能 不 同 的 是 , 这 里 是 通过 列表 保存 了 一 份 去 重复 前 的 原始 数据 , 这 样 哪怕 对 去 重复 后 的 
数据 操作 有 误 ， 也 能 通过 原始 数据 进行 恢复 。 
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2.2.2 ”常见 的 集合 操作 方法 


在 数据 统计 和 分 析 场 景 里 ， 经 常会 对 不 同 的 对 象 进行 各 种 集合 操作 ， 比 如 交集 、 并 集 和 差 集 
等 ， 通 过 集合 提供 的 方法 ， 可 以 比较 便捷 地 实现 这 一 功能 。 在 下 面 的 SetHandleData.py 范例 程序 中 
演示 了 集合 的 各 种 操作 。 
1 # !/usr/bin/env Python 
bd # coding=utf-8 
3 ”# 以 大 括号 的 方式 定义 集合 
4 Seti = VI 3 Sn 半 
5 eto = for or rove v7 
6 “# 不 能 用 中 括号 的 方式 定义 集合 ,例如 set1 = ['1','3','5'，'7'] 
7 
8 


# 交集 
set3 = setl & set2 
9 print (set3) # 输出 see0lrr 
10 print(setl & set2) # 输出 set (['3'，'7']) 
11 print(setl.intersection(set2)) # 输出 set(['3'，'7']) 
12 # 并 集 
13 set4 = setl | set2 
14 Print (set4) # 输出 set (['1',， 13'， 2', 15',，'7'，'6']) 
15 print(setl | set2) SE a UO OY 
16 Print(setl.union(set2) ) tl ek ht) 
17 # 差 集 
18 print(setl - set2) # 输出 set (['1'，'5']) 
19 print(setl.difference(set2)) # 和 输出 set(['1'，'5']) 
20 print(set2 - setl) # 输出 set (['2'，'6']) 


21 print(set2.difference(set1)) # 输 出 set(['2'，'6']) 
22 ”# 演示 不 可 变 集合 的 特性 
23 unChangedSet = frozenset (3.14,9.8) 
24 # unChangedSet.add(2.718) 
25 # unChangedSet [0]=2.718 
26 # unChangedSet.discard(3.14) 

之 前 提 到 ， 定 义 列表 时 用 方 括 号， 定义 元 组 时 用 小 括号 ， 定 义 集合 对 象 时 ， 要 像 第 4 行 和 第 5 
行 中 那样 通过 大 括号 。 这 里 请 注意 ， 如 果 像 第 6 行 那样 ,通过 方 括号 定义 的 是 列表 ,那么 列表 类 对 
象 是 无 法 参与 后 面 的 各 种 针对 集合 的 操作 的 。 

从 第 8 行 到 第 11 行 的 程序 语句 演示 了 集合 交集 的 操作 ， 具 体 可 以 像 第 8 行 和 第 10 行程 序 语 
句 那样 使 用 “&” 运 算 符 ， 也 可 以 像 第 11 行 那样 通过 调用 intersection 方法 来 求 交集 。 通 过 打印 语 
名 可 以 看 到 ， 返 回 的 结果 是 setl 和 set2 中 都 有 的 元 素 ， 即 交集 ， 由 此 能 验证 求 交集 的 结果 。 而 从 
第 13 行 到 第 16 行 的 程序 语句 是 使 用 “|” 运 算 符 和 调用 union 方法 来 求 并 集 。 

从 第 18 行 到 第 21 行 的 程序 语句 ， 是 使 用 “-” 运 算 符 和 调用 difference 方法 来 求 两 个 集合 的 差 
集 ， 即 返回 在 第 一 个 集合 中 有 且 在 第 二 个 集合 中 没有 的 元 素 。 

在 前 文中 介绍 过 ， 可 以 用 元 组 来 保证 列表 元 素 的 不 可 操作 性 ， 在 上 面 范 例 程序 的 第 23 行 中 通 
过 调用 frozenset 来 保证 集合 元 素 的 不 可 操作 性 。 如 果 去 掉 第 24 行 到 第 26 行 的 注释 ， 就 会 发 现 无 
法 通过 程序 代码 来 修改 frozenset 类 型 的 unChangedSet 中 的 元 素 ， 由 此 可 以 验证 这 种 方式 实现 的 列 
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表 的 元 素 的 “不 可 操作 性 ”。 
2.2.3 ”通过 覆盖 sort 定义 排序 逻辑 


在 集合 (以 及 之 前 的 列表 ) 中 ， 都 可 以 通过 调用 sort 方法 对 集合 内 的 元 素 进行 排序 。 在 默认 
的 情况 下 ，sort 方法 是 会 按 升序 的 方式 排序 集合 中 的 元 素 ， 这 里 就 涉及 一 个 问题 ,程序 员 在 开发 时 
如 何 定义 排序 的 标准 ? 比如 如 何 把 排序 的 标准 设置 为 “降序 ”? 

在 下 面 的 SetSortDemo.py 范例 程序 中 , 演示 了 列表 降序 排列 的 方法 , 具体 做 法 是 ,在 调用 sort 
方法 时 ， 传 入 了 “定义 排序 规则 ”的 desc 方法 。 


# !/usr/bin/env Python 
# coding=utf-8 
# 定义 降序 规则 
def desc(x, y): 
bd 
return 1 # 如 果 x 小 于 yY， 则 x 排 在 Y 之 前 
ES 
return -1 # 如 果 x 大 于 y， 则 x 排 在 y 之 后 
9 else: 
10 return 0 # 否则 并 列 
11  # 定义 待 排序 的 numbers 列表 
12 numbers = [5, 58, 47 ,75 ,100] 
13 numbers.sort (desc) # 在 排序 时 用 到 desc 方法 


co vawmwwNP 


14 print numbers # 输出 [100，75，58，47，5] 
15 numbers.sort() 
16 print numbers # 输出 [5，47，58，75，1001] 


在 第 13 行 中 通过 调用 sort 方法 对 numbers 列表 进行 排序 ， 与 之 前 不 同 的 是 ， 这 里 传 入 了 desc 
方法 ， 用 来 定义 排序 的 规则 。 

第 4 行 到 第 10 行 的 程序 语句 定义 desc 方法 时 ， 定 义 的 排序 规则 是 : 如 果 x 小 于 y， 则 返回 1， 即 
x 排 在 y 之 前 ， 如 果 大 于 ， 则 返回 -1，x 排 在 y 之 后 ， 如 果 相 等 则 返回 0， 即 两 数 并 列 。 在 第 14 行 和 第 
16 行 中 ， 打 印 了 以 不 同方 式 排序 后 的 列表 ， 从 输出 结果 上 来 看 ， 分 别 实现 了 降序 和 升序 的 排序 。 

其 实 ， 这 里 定义 排序 规则 和 在 sort 方法 里 通过 参数 传 入 规则 的 代码 都 不 复杂 ， 但 请 大 家 熟悉 
这 种 “通过 传 入 参数 定义 规则 ”的 编写 程序 的 方式 ， 这 种 定义 排序 规则 的 做 法 在 实际 项 目 中 会 经 常 
用 到 。 


2.3 通过 字典 存 放 “ 键 - 值 对 ”类 型 的 数据 


Python 中 的 字典 (Dict) 也 是 数组 的 一 种 ， 在 其 中 能 以 “ 键 - 值 对 ” (Key-Value Pair) 的 方式 
存放 多 个 数据 。 在 字典 中 ,是 用 基于 哈 希 表 的 方式 来 保存 数据 ， 所 以 数据 查找 的 速度 非常 快 ， 哪 怕 
其 中 存储 的 数据 再 多 ， 也 能 以 O(1) 的 计算 复杂 度 找 到 数据 ， 即 基本 是 一 次 查找 就 命中 。 

和 其 他 程序 设计 语言 一 样 ，Python 中 的 字典 一 般 是 用 来 存储 多 个 数据 ， 而 不 是 一 个 。 
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2.3.1 针对 字典 的 常见 操作 


字典 主要 用 来 存储 “ 键 - 值 对 ”的 数据 ， 在 DictDemo.py 范例 程序 中 ， 展 示 了 在 项 目 中 的 常见 
操作 字典 的 用 法 。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 ”# 定义 并 打印 字典 

4 onePersonInfo = {'name': 'Mike', 'age': 7} 

本 Print (onePersonInfo) # {'age': 7, 'name': 'Mike'} 
6 onePersonInfo['age']=8 # 修改 其 中 的 元 素 

7 “print (onePersonInfo) # age 会 变 成 8 

8 Print (onePersonInfo['name'] ) # Mike 

9 del onePersonInfo['name'] 

10 print (onePersonInfo) # age 会 变 成 8 #{'age': 8} 
11 print(onePersonInfo.get('name')) # None 

12 Print (onePersonInfo.get('age')) # 8 

13 if 'name' not in onePersonInfo: 

14 onePersonInfo['name']="Mike" # 增加 新 元 素 


15 Print (onePersonInfo.get('"name')) # Mike 
16 ”# 通过 for 循环 遍历 字典 
17 for i,v in onePersonInfo.items () : 
18 print (i,v) # 得 到 键 和 值 

在 上 述 范例 程序 中 的 第 4 行 是 通过 大 括号 ( 即 f}) 来 定义 字典 ， 而 且 是 通过 冒号 的 方式 来 定 
义 “ 键 - 值 对 ”， 比 如 用 'name': 'Mike' 的 形式 ， 即 表示 name 这 个 键 的 值 是 Mike。 请 注意 ， 多 个 “ 键 
- 值 对 ”之 间 是 用 逗号 分 隔 。 

在 第 6 行 中 , 演示 了 可 以 通过 方 括号 的 方式 来 访问 onePersonInfo 这 个 字典 类 型 中 的 'age' 键 ， 
并 把 它 的 值 改 成 8， 通 过 第 7 行 的 打印 语句 就 能 看 到 这 一 修改 后 的 结果 。 

可 以 像 第 9 行 那样 用 del 语句 ， 还 是 通过 方 括号 的 形式 ， 删 除 字典 中 指定 的 “ 键 - 值 对 ”， 完 
成 删除 后 ， 如 果 通 过 第 11 行 的 get 语句 来 获取 "name'"， 则 会 返回 None， 即 表示 没 找到 对 应 的 值 。 
这 里 get 的 作用 是 获取 字典 中 指定 键 对 应 的 值 ， 比 如 在 第 12 行 中 ， 可 以 通过 get, 输出 'age' 这 个 键 
对 应 的 值 。 

还 可 以 通过 in 和 not in 来 判断 在 字典 里 有 没有 指定 的 键 ， 比 如 在 第 13 行 中 ， 在 让 语句 中 用 
not in 来 判断 onePersonInfo 这 个 字典 里 是 否 有 'name'， 由 于 之 前 在 第 9 行 中 已 经 删除 了 这 个 键 ， 因 
此 这 里 执行 第 14 行 的 代码 ， 在 字典 里 增加 mame' 等 于 "Mike" 这 个 “ 键 - 值 对 ”。 

在 第 17 行 和 18 行 中 ， 通 过 for 循环 遍历 了 onePersonInfo 字典 ， 其 中 值得 关注 的 是 ， 首 先是 
通过 items 方法 获取 字典 中 所 有 的 “ 键 - 值 对 ”, 其 次 是 在 for 循环 中 通过 i 和 v 来 映射 字典 中 的 “ 键 
- 值 对 ”。 第 17 行程 序 语句 中 的 1 和 v 的 变量 名 可 以 随便 起 ， 和 第 18 行 print 语句 中 保持 一 致 即 可 。 


2.3.2 在 字典 中 以 复杂 的 格式 存储 多 个 数据 


在 2.3.1 小 节 中 , 我 们 在 字典 中 存放 了 一 条 关于 人 的 信息 ， 比 如 名 字 叫 Mike, 年龄 是 7 岁 。 而 
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在 实际 项 目 中 , 往往 会 在 字典 中 存储 相同 数据 类 型 格式 的 多 个 数据 ,而 且 还 会 出 现在 字典 中 媒 套 了 
列表 等 的 复杂 用 法 。 在 下 面 的 DictMoreData.py 范例 程序 中 将 演示 这 些 用 法 。 


# !/usr/bin/env Python 

2 # coding=utf-8 

3 ”# 以 列表 方式 定义 Mike 和 Tom 两 个 人 的 账户 

4 accountsInfoList = [{'name': 'Mike', 'balance': 

100,'stockList':['600123','600158']},{'name': 'Tom', 'balance': 

200,'stockList':['600243','600558']} ] 

5 ”# 通过 for 循环 ， 依 次 输出 列表 中 的 元 素 

6 for ;item in accountsInfoList: 

oY print (item['name'],) # print 后 带 有 逗号 表示 不 换行 

8 Print (item['balance'],) 

9 print(item['stockList']) 

10 ”# 以 字典 的 方式 定义 

1 accountInfoDict={f 'Peter':{'balance': 100,'stockList':['600123', 

'600158'] },'Tom': { 'balance': 200,'stockList':['600243','600558']} } 

12 # 输出 {'balance': 100,，'stockList': ['600123',，'600158']} 

13 print(accountInfoDict.get('Peter')) 

14 PeterAccount={ 'Peter':{'balance': 
200,'stockList':['600223','600158',600458] }} 

15 accountInfoDict.update (PeterAccount) 

16 print(accountInfoDict.get('Peter')) # 能 看 到 更 新 后 的 内 容 

17 JohnAccount={ ‘'John':{'balance': 200,'stockList':[] }} 

18 accountInfoDict.update (JohnAccount) 

19 ## 利用 双 层 循环 打印 


20 for name,account in accountInfoDict.items () : 


21 print ("name is %s:"%(name))， ## 输出 name 后 不 换行 
22 for key,value in account .items () : 
23 Print (value,) 


24 Print () # 输 完 一 个 人 的 信息 后 换行 


在 第 4 行 中 用 方 括 号 的 方式 定义 了 accountsInfoList 列表 对 象 ， 在 其 中 用 大 括号 的 方式 定义 了 
两 个 “ 键 - 值 对 ”类 型 的 账户 信息 , 在 第 6 行 到 第 9 行 的 for 循环 里 ,依次 输出 了 这 两 个 账户 信息 里 
的 三 个 “ 键 - 值 对 ”， 输 出 的 结果 如 下 所 示 : 

Mike 100 ['600123', '600158'] 
Tom 200 ['600243', '600558'] 

在 第 11 行 中 用 大 括号 的 方式 定义 了 accountInfoDict 这 个 字典 类 型 的 数据 ， 其 中 同样 存放 了 两 
个 人 的 账户 信息 。 在 实际 项 目的 集合 对 象 中 , 不 可 能 只 存储 一 个 数据 ,大 家 要 掌握 这 种 用 列表 或 字 
典 保 存 多 个 数据 的 方式 。 

字典 对 象 中 的 另 一 个 比较 实用 的 方法 是 update， 它 有 两 层 含义 ， 如 果 字 典 对 象 中 已 经 有 相同 
的 键 ， 那 么 就 用 对 应 的 值 更 新 原来 的 值 。 比 如 在 第 14 行 中 ， 更 新 了 Peter 的 balance 和 stockList 信 
息 ， 在 第 15 行 的 update 语句 中 ， 就 会 用 第 14 行 中 定义 的 对 应 值 ( 即 balance 和 stockList) 更 新 掉 
原来 的 值 ， 通 过 第 16 行 的 print 语句 就 能 看 到 这 一 更 新 后 的 结果 

update 语句 另外 的 一 层 含义 是 ， 如 果 在 字典 中 没有 待 更 新 的 “ 键 ”， 那 么 就 会 插入 对 应 的 “ 键 
- 值 对 ”。 比 如 在 第 17 行 中 ， 定 义 原本 不 存在 于 accountInfoDict 字典 对 象 的 JohnAccount， 一 旦 执 
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行 了 第 18 行 的 update 语句 就 会 完成 更 新 ， 后 面 的 打印 语句 即 可 看 到 插入 更 新 后 的 结果 。 

由 于 在 accountInfoDict 这 个 字典 类 对 象 中 存储 了 结构 比较 复杂 的 对 象 ， 比 如 值 也 是 字典 类 型 ， 
而 stockList 是 列表 类 型 ， 因 此 在 20 行 到 第 24 行 中 用 双 层 for 循环 来 遍历 这 个 字典 对 象 。 

其 中 ， 在 第 21 行 中 输出 了 每 个 字典 中 的 “ 键 ”， 即 姓名 信息 ， 输 完 后 不 换行 。 在 第 22 行 的 
内 层 for 循环 里 调用 了 item 方法 ， 依 次 遍历 了 accountInfoDict 对 象 中 的 “ 值 ” 信息 (也 是 字典 类 型 
的 对 象 ) ,遍历 完 一 个 人 的 账户 信息 后 , 会 在 第 24 行 中 通过 print 语句 进行 换行 ， 这 段 语 句 的 输出 
结果 如 下 ， 其 中 包含 新 增 的 John 的 账户 信息 。 

name is Peter: 200 ['600223', '600158', 600458] 

name is John: 200 [] 

name is Tom: 200 ['600243', '600558"'] 

虽然 可 以 在 字典 中 存放 各 种 类 型 的 数据 ， 但 应 当 用 同一 种 格式 存储 多 个 数据 ， 比 如 在 第 11 行 
中 用 'mame': frbalance': xx, 'stockList:[xx]} 的 格式 输入 并 存储 多 个 人 的 账户 信息 。 

这 样 做 的 好 处 是 ， 由 于 事先 约定 好 能 用 同一 种 方式 来 解析 字典 中 的 数据 ， 因 此 解析 数据 的 规 
则 是 统一 的 。 这 点 在 Java 等 语言 中 能 用 泛 型 来 保证 ， 但 在 Python 语言 中 ， 如 果 两 个 数据 的 格式 不 
一 致 ， 也 不 会 出 现 语 法 错误 ， 但 这 样 的 做 法 就 会 造成 处 理 方 式 的 不 统一 。 所 以 在 使 用 Python 字典 
类 对 象 时 ， 程 序 员 应 当时 刻 注 意 这 点 。 


2.4 针对 数据 结构 对 象 的 常用 操作 


在 数据 分 析 等 应 用 场景 中 ， 比 较 关 键 的 就 是 数据 存储 与 数据 操作 。 在 前 文中 ， 讲 述 了 以 列表 、 
元 组 和 字典 的 形式 存储 数据 的 方法 ， 下 面 将 讲述 Python 中 常用 的 操作 数据 的 方法 。 


2.4.1 映射 函数 map 


通过 调用 map 函数 ， 就 能 根据 指定 的 函数 对 指定 序列 执行 映射 运算 ， 它 的 语法 如 下 。 
map (function, parameter) 


其 中 , 第 一 个 参数 function 表示 映射 运算 的 规则 , 第 二 个 参数 parameter 则 表示 待 映射 的 对 象 。 
在 下 面 的 MapDemo.py 范例 程序 中 演示 的 是 映射 的 效果 。 


# !/usr/bin/env python 
# coding=utf-8 
def square (x) : # 计算 平方 数 
YetEUZRI x ss 二 之 
print (List(map(square，[1,3,5])))  # 输出 [L，9，251] 


def strToLowCase (Str) : 
return str.lower() 
strList=["Company", "OFFICE"] 


时 
忆 
3 
4 
5 
6 
有 
8 
9 
和 strList = map(strToLowCase, strList) 


口 
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11 print(list(strList)) # ['company', "office'] 


12 

13 def tagCustomer (num): 

14 if num>5000: 

5 roturn MVIP” 

16 else: 

7 return "Normal" 

18 print (list(map(tagCustomer, [1000]))) # ['Normal'] 
19 #print map (tagCustomer,1000) # 会 报错 


在 第 3 行 和 第 4 行 中 通过 def 定义 了 一 个 计算 平方 数 的 函数 square， 在 第 $ 行 的 map 方法 中 ， 
第 一 个 参数 是 这 个 函数 , 第 二 个 参数 则 是 待 计算 平方 数 的 列表 ， 从 第 5 行 的 打印 语句 来 看 , 输出 的 
是 1，3，5 的 平方 数 。 从 中 可 知 ，map 方法 会 把 用 第 1 个 参数 指定 的 函数 运用 于 第 2 个 参数 指定 的 
序列 ， 并 把 计算 好 的 结果 返回 。 

在 第 7 行 和 第 8 行 的 函数 中 实现 了 “把 输入 参数 转 为 小 写字 母 ” 的 功能 ， 在 第 10 行 中 ， 同 样 
调用 了 map 方法 ,把 strList 这 个 列表 里 的 元 素 转 成 了 小 写字 母 ， 从 第 11 行 输 出 语句 的 结果 中 即 可 
看 到 “ 转 为 小 写字 母 ”的 效果 。 

通过 调用 map 方法 还 可 以 实现 基于 规则 的 映射 ， 比 如 在 某 个 项 目 中 有 这 样 的 定义 ， 凡 是 消费 
金额 高 于 5000 元 的 客户 ， 将 加 上 VIP 的 标识 ， 否 则 是 一 般 用 户 。 通 过 第 13 行 到 第 18 行 的 代码 ， 
调用 map 函数 即 可 实现 这 一 映射 的 效果 。 

不 过 要 注意 的 是 ，map 方法 第 二 个 参数 需要 是 “可 以 遍历 ” (或 可 和 迭代 ) 的 对 象 ， 比 如 列表 
元 素 或 字典 等 ， 如 果 像 第 19 行 那 样 ， 把 整数 数据 类 型 作为 参数 ， 则 会 出 现 如 下 的 错误 提示 ， 因 为 
第 二 个 参数 不 具有 可 和 迭代 特性 〈Iteration) 。 


TypeError: argument 2 to map() must support iteration 


2.4.2 ”筛选 函数 filter 


该 函数 的 语法 为 filter(function, iterable)。 有 具体 的 含义 是 ， 根 据 第 1 个 参数 指定 的 函数 ， 过 滤 掉 
第 2 个 参数 指定 对 象 中 不 符合 要 求 的 元 素 。 在 下 面 的 FilterDemo.py 范例 程序 中 来 演示 一 下 filter 函 
数 的 相关 用 法 。 


1 # !/usr/bin/env Python 

可 # coding=utf-8 

3 ”# 判断 输入 参数 是 否 是 小 写字 母 的 函数 

4 def isLowCase(str) : 

5 return str.lower() == str 

6 strlist = filter(isLowCase, ["Hello","world"]) 
7 print(list(strlist)) # ['world'] 

8 “ 判断 输入 参数 是 否 为 空 的 函数 

9 def filterNull (empNo): 

10 return empNo.strip() !="'" 

11 dataFromFile=['101','102','103',''] 

12 empList = filter(filterNull,dataFromFile) 

13 print(list(empList)) # ['101', '102', '103'] 
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在 第 4 行 和 第 5 行 中 定义 了 isLowCase 函数 ， 在 其 中 判断 输入 参数 是 否 为 小 写字 母 。 

在 第 6 行 中 定义 的 filter 方法 第 一 个 参数 即 为 LowCase ,指定 判断 的 规则 是 “都 为 小 写字 母 ” 
第 二 个 参数 是 一 个 包含 字符 串 的 列表 。 这 里 filter 方法 的 作用 是 ， 依 次 对 "Hello" 和 "world" 这 两 
个 字符 串 运行 isLowCase 函数 ， 如 果 返 回 false 则 过 滤 掉 ， 返 回 true 则 保留 。 这 样 strList 对 象 就 只 
包含 了 小 写字 母 的 字符 串 ， 从 第 7 行 打印 语句 的 输出 结果 中 即 可 看 到 这 一 过 滤 结 果 。 

在 第 9 行 和 第 10 行 的 filterNull 方法 中 ， 用 来 判断 输入 参数 是 否 为 空 ， 在 第 11 行 中 定义 的 
dataFromFile 列表 里 ， 包 含 了 一 个 空 的 元 素 ， 这 样 执行 第 12 行 的 filter 方法， 就 能 把 其 中 空 元 素 过 
滤 掉 ， 从 第 13 行 print 语句 的 输出 结果 中 即 可 看 到 过 滤 掉 空 元 素 之 后 的 效果 。 


2.4.3 ”累计 处 理 函 数 reduce 


Python 中 的 reduce 函数 会 调用 指定 的 函数 对 参数 序列 中 的 元 素 从 左 到 右 进 行 累计 处 理 ， 这 句 
话 看 上 去 有 些 难 懂 ， 下 面 通过 ReduceDemo.py 范例 程序 来 看 看 这 个 函数 的 作用 。 
# coding=utf-8 
from functools import reduce 
# 定义 一 个 加 法 的 函数 add 
def add(x, y): 
return xz ty 
print (reduce (add, [1,2,3,4,5])) # 输出 15 
print (reduce (add, [1,2,3,4,5],100)) # 输出 115 
# 定义 乘法 的 函数 
9 def multiply (x,y): 
10 return x*y 
11 print(reduce(multiply, [1,2,3,4,5])) # 输出 120 
12 ”# 定义 拼接 数字 的 函数 
13 def combineNumber (x, y): 
14 OtUurn XT * 10 oy 
15 print(reduce(combineNumber，[1,2,3,4,5])) # 输出 12345 


在 第 4 行 和 第 5 行 中 定义 了 一 个 实现 加 法 功能 的 add 函数 (或 称 为 方法 ), 在 第 6 行 中 , reduce 
的 第 一 个 参数 即 为 add， 第 二 个 参数 是 一 个 包含 1 到 5 的 序列 。 

这 里 reduce 函数 的 含义 是 , 先 取 左边 的 两 个 参数 1 和 2, 把 它们 作为 add 方法 的 两 个 输入 参数 ， 
经 add 函数 返回 的 结果 是 3， 再 把 3 和 从 左 到 右 的 第 3 个 序列 (也 是 3) 作为 add 函数 的 两 个 输入 
参数 ， 这 时 add 函数 的 返回 值 是 6， 再 用 6 和 第 4 个 序列 (数字 4) 作为 add 函数 的 两 个 输入 参数 ， 
以 此 类 推 。 所 以 结果 是 1 到 5 的 累加 和 ， 即 15， 第 7 行 的 输出 语句 验证 了 这 一 结果 。 同 理 ， 通 过 
第 11 行 的 reduce 方法， 实现 了 1 到 5 的 阶乘 效果 。 

在 第 13 行 和 第 14 行 的 combineNumber 方法 中 ， 定 义 了 拼装 两 个 数字 的 函数 ， 比 如 输入 参数 
是 1 和 2， 那 么 会 返回 12。 在 第 15 行 中 通过 调用 reduce 方法 ， 从 左 到 右 拼 装 了 1 到 5 这 个 序列 ， 
返回 结果 是 12345 。 

从 这 个 范例 程序 的 代码 中 可 知 ，reduce 具有 “递归 操作 ”的 功能 ， 即 从 左 到 右 读 取 序 列 ， 把 
两 个 数值 (或 上 一 次 运算 的 结果 和 下 一 个 数值 ) 作为 参数 传 入 指定 的 函数 ， 由 此 完成 针对 整个 序列 
的 操作 或 运算 。 
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2.4.4 通过 Lambda 表达 式 定义 匿名 函数 


在 之 前 的 范例 程序 中 ， 我 们 通过 def 语句 定义 函数 时 ， 会 指定 函数 的 名 字 ， 但 在 某 些 场合 ， 函 
数 内 的 代码 非常 简单 ， 不 值得 “大 张 旗 鼓 ”地 定义 函数 名 以 及 用 return 返回 结果 ， 这 时 就 可 以 通过 
Lambda 表达 式 来 定义 匿名 函数 ， 以 此 来 简化 代码 。 
在 下 面 的 LambdaSimpleDemo.py 范例 程序 中 演示 了 Lambda 的 用 法 ， 请 大 家 注意 Lambda 和 
map 等 函数 整合 使 用 的 编程 逻辑 。 
# !/usr/bin/env python 
# coding=utf-8 
# 通过 lambda 表达 式 定义 了 一 个 匿名 函数 
add = lambda a,b,c:atbtc 
print (add(1,2,3)) # 输出 6 
# 计算 奇数 
numbers = [1,3,6,7,10,11] 
# 与 filter 整合 使 用 
9 numbers = filter(lambda input: input%2!=0, numbers) 
10 print numbers #[1, 3, 7, 11] 
11 numbers = [2, 3, 4] 
12 # 与 map 整合 使 用 
13 numbers = map (lambda x: x*x, numbers) 
14 print numbers #[4, 9, 16] 
15 # 与 reduce 整合 使 用 
16 numbers = [1,2,3,4,5] 
17 sum = reduce(lambda x, y: x + y, numbers) 
18 print sum # 输出 15 
19 # 与 sorted 整合 使 用 
20 numbers = [1,-2, 3, -4,5] 
21 numbers = sorted(numbers, lambda x, y: abs(y)-abs (x)) 
22 print numbers # [5, -4, 3, -2, 1] 


在 第 4 行 中 演示 了 Lambda 定义 匿名 函数 的 基本 做 法 。 这 里 没有 定义 函数 名 ,也 即 是 定义 了 个 
匿名 函数 。 在 lambda 关键 字 之 后 有 3 个 变量 ， 即 为 匿名 函数 的 三 个 参数 ， 在 冒号 之 后 则 定义 了 该 
Lambda 表达 式 〈 也 就 是 匿名 函数 ) 的 返回 值 ， 这 个 匿名 函数 是 计算 三 个 输入 参数 的 和 ， 而 在 等 号 
左边 的 add 则 是 这 个 lambda 表达 式 的 名 字 。 第 5 行 的 程序 语句 用 到 了 add 来 调用 第 4 行 定 义 的 
Lambda 表达 式 。 

在 第 9 行 中 把 Lambda 表达 式 和 filter 函数 整合 到 一 起 。 前 面 介 绍 过 ，filter 函数 的 第 一 个 参数 
指定 了 过 滤 规 则 ， 这 里 通过 Lambda 表达 式 指 定 “ 只 保留 满足 input%2!=0 条 件 ” 的 数 ， 即 只 保留 
奇数 ， 第 10 行 的 print 语句 验证 了 这 个 filter 函数 的 效果 。 

在 第 13 行 中 整合 使 用 了 Lambda 表达 式 和 map 函数 , 依次 对 列表 中 的 每 个 元 素 进行 了 “乘积 ” 
的 操作 , 对 第 16 行 定义 的 numbers 列表 中 的 每 个 值 进行 了 累加 的 操作 , 在 第 17 行 中 整合 了 Lambda 
表达 式 和 reduce 函数 。 

在 第 21 行 中 ， 在 sorted 函数 的 第 二 个 参数 中 ， 通 过 Lambda 表达 式 定义 了 针对 numbers 序列 
的 排序 规则 。 通 过 Lambda 表达 式 定 义 的 排序 规则 是 : 如 果 y 的 绝对 值 大 于 x 的 绝对 值 ， 则 y 排 在 
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x 之 前 ， 反 之 则 y 在 x 之后。 通过 第 22 行 的 输出 即 可 验证 这 一 结果 。 
除了 能 定义 匿名 函数 ，Lambda 表达 式 的 另 一 个 用 法 是 把 函数 作为 “输入 参数 ”， 即 可 以 定义 
“高 级 函数 ”， 在 下 面 的 LambdaSeniorDemo.py 范例 程序 中 示范 了 这 种 用 法 。 


# !/usr/bin/env Python 
# coding=utf-8 
# 第 3 个 参数 是 Lambda 表达 式 
def add (xy func) : 
return func(x) + func(y) 


print (add (2,4,1ambda a:a*a)) # 2 的 平方 加 4 的 平方 等 于 20 
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print ("My Stock List".find("stock")) # 输出 -1， 表 示 没 找到 
9 def existKey (key,words,func): 

10 return func (words) .find(key) 

11 输出 3， 表 示 找 到 了 


12 print(existKey("stock","My Stock List" ,lambda words:words.lower())) 

在 第 4 行 定义 的 add 函数 中 ， 第 3 个 参数 func 其 实 是 个 函数 ， 在 第 6 行 的 调用 中 ， 我 们 传 入 
的 func 函数 是 对 输入 参数 a 进行 平方 运算 ， 所 以 add 函数 返回 的 结果 是 x 和 y 的 平方 和 。 

在 字符 串 比 较 的 过 程 中 ， 一 般 不 会 区 分 字母 大 小 写 ， 一 般 的 做 法 是 把 目标 字符 串 转 成 小 写字 
母 ， 而 把 待 比较 的 字符 串 也 转换 成 小 写字 母 。 

在 第 9 行 的 existKey 函数 中 ， 通 过 第 3 个 参数 定义 了 针对 words 输入 参数 的 操作 。 而 在 第 12 
行 的 调用 时 ， 用 Lambda 编写 的 操作 是 通过 lower 把 输入 参数 转 小 写 ， 所 以 在 existKey 的 函数 中 ， 
首先 是 调用 func 函数 ， 把 输入 参数 words 转 成 小 写 ， 随 后 再 看 其 中 是 否 存在 key ( 即 stock) ， 由 
于 存在 ， 因 此 第 12 行 的 print 语句 会 输出 3， 表 示 stock 在 字符 串 中 所 处 的 位 置 。 

从 上 述 两 个 范例 程序 中 ， 大 家 看 到 了 Lambda 作为 函数 输入 参数 的 做 法 。 请 注意 ， 一 般 通过 
Lambda 表达 式 只 会 定义 功能 比较 简单 的 匿名 函数 。 

如 果 函 数 需 要 实现 的 功能 比较 复杂 ， 那 么 应 该 采用 比较 复杂 的 def 方式 来 定义 函数 ， 因 为 用 
Lambda 表达 式 定义 复杂 的 逻辑 ， 第 一 是 实现 起 来 很 难 ， 第 二 则 是 可 读 性 很 差 。 


2.5 ”本章 小 结 


数据 分 析 是 Python 语言 比较 广泛 的 用 途 之 一 ,数据 存储 也 是 Python 语言 中 的 一 个 重要 知识 点 ， 
在 本 章 里 ， 读 者 学 到 了 列表 、 元 组 和 字典 类 数据 对 象 的 常见 操作 用 法 。 

数据 存储 和 数据 操作 是 两 个 密 不 可 分 的 课题 ， 所 以 本 章 没 有 过 于 简单 地 讲解 集合 类 对 象 的 用 
法 ， 也 没 机 械 地 罗列 出 数据 操作 函数 或 方法 的 名 称 和 参数 ， 而 是 重点 讲述 了 “数据 操作 ”如 何 作用 
于 “数据 结构 ”的 知识 , 让 大 家 通过 范例 程序 看 到 map、filter、 reduce 函数 (或 称 为 方法 ) 和 Lambda 
表达 式 作 用 于 列表 等 集合 类 对 象 的 做 法 。 

如 果 读 者 在 学 习 Python 集合 对 象 时 ， 能 围绕 “数据 存储 方式 ”和 “数据 操作 ”这 两 大 主题 ， 
那么 在 学 习 时 一 定 能 起 到 事半功倍 的 效果 。 


Python 面向 对 象 程序 设计 思想 的 实践 


发 程序 的 精 散 在 于 “ 复 用 ”和 “可 扩展 ”一 一 首先 能 复 用 功能 相同 的 模块 ， 其 次 ， 当 现 有 
项 目的 需求 点 有 变更 时 ， 程 序 员 能 用 很 小 的 代价 实现 对 应 的 更 改 ， 要 做 到 这 两 点 ， 离 不 开 面 向 对 象 
程序 设计 的 思想 。 
封装 、 继 承 和 多 态 是 面向 对 象 程序 设计 思想 的 三 大 要 素 ， 虽 然 在 实际 的 项 目 中 ， 开 发 者 可 能 
还 没 意 识 到 已 经 用 到 了 面向 对 象 。 相反 ,如 果 不 使 用 这 三 大 要 素 , 很 多 功能 实现 起 来 要 么 代码 的 结 
构 很 差 ， 要 么 编写 出 来 的 代码 很 难 扩展 。 

在 本 章 中 ， 读 者 不 会 看 到 枯燥 的 关于 面向 对 象 理 论 的 描述 ， 也 看 不 到 条 列 式 地 列举 相关 的 语 
法 ， 而 会 看 到 综合 性 地 使 用 面向 对 象 三 大 要 素 提 升 代码 结构 的 做 法 。 并 且 ， 本 章 给 出 的 大 多 数 知 识 
点 不 是 “ 假 大 空 ”的 万 金 油 ， 而 是 专门 适用 于 Python 语言 。 


3.1 ”把 属性 和 方法 封装 成 类 ， 方 便 重复 使 用 


假如 我 们 要 经 常 实现 买卖 股票 的 功能 ， 一 种 做 法 是 在 每 一 处 都 定义 一 遍 股票 价格 交易 日 期 等 
属性 , 外 带 实现 买卖 功能 的 方法 。 与 这 种 极 不 方便 做 法 相 比 , 基于 面向 对 象 的 做 法 是 , 用 类 (Class) 
把 股票 的 相关 属性 和 方法 封装 起 来 , 用 的 时 候 再 通过 创建 实例 来 操作 具体 的 股票 。 注意: 在 面向 对 
象 的 程序 设计 中 ， 更 习惯 把 传统 函数 (Function ) 功能 模块 称 为 方法 (Method) ， 因 为 方法 是 面向 
对 象 程序 设计 的 标准 术语 。 因 此 ， 在 本 书 描述 中 当 只 强调 功能 时 ， 会 混用 “函数 ”和 “方法 ”不 太 
加 以 区 分 。 而 在 特别 强调 面向 对 象 程序 设计 概念 的 描述 中 ， 则 一 般 只 使 用 “方法 ”。 

上 述 描述 中 涉及 两 个 概念 : 类 和 对 象 。 其 中 类 是 比较 抽象 的 概念 ， 比 如 和 人 类， 股票 类 ， 而 对 
象 也 叫 类 的 实例 ， 是 相对 有 具体 的 概念 ， 比 如 入 类 的 实例 是 “ 张 三 ” 这 个 活生生 的 人 ， 股 票 类 的 实例 
则 是 某 一 只 具体 的 股票 。 对 象 是 通过 类 来 创建 的 ， 创 建 对 象 的 过 程 也 叫 “ 实 例 化 ”。 
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3.1.1 在 Python 中 定义 和 使 用 类 


当 大 家 熟悉 面向 对 象 程序 设计 的 思想 后 ， 一 提 到 封装 ， 就 应 当 想 到 类 ， 因 为 在 项 目 中 是 在 类 
里 封装 属性 和 方法 。 

在 下 面 的 ClassUsageDemo.py 范例 程序 中 , 可 以 看 到 定义 和 使 用 类 的 基本 方式 .通过 这 段 代 码 ， 
可 以 看 到 类 是 通过 封装 属性 (比如 stockCode 和 price) 和 方法 实现 了 功能 的 重复 使 用 (简称 复 用 ) 。 


二 # !/usr/bin/env Python 

2 # coding=utf-8 

3 ”<# 定义 类 

4 class Stock: 

5 def init (self, stockCode, price): 

6 self.stockCode, self.price = stockCode,price 

7 def get_ stockCode (self) : 

8 return self.stockCode 

9 def set_stockCode (self, stockCode) : 

10 self.stockCode = stockCode 

rE def get pricel(self): 

12 return self.price 

3 def set pricel(self,price): 

14 self.price = price 

5 def display(self) : 

16 Print("Stock code is:{}, price 
is:{}.".format (self.stockCode, self.price)) 

17 # 使 用 类 


18 myStock = Stock("600018",50)  ”# 实例 化 一 个 对 象 myStock 
19 myStock.display() #Stock code is:600018, price is:50. 
20 ## 更 改 其 中 的 值 

21 myStock.set_ stockCode("600020") 

22 print(myStock.get_stockCode()) # 600020 

23 myStock.set price(60) 

24 Pprint(myStock.get price()) # 60 


在 第 4 行 中 通过 class 关键 字 定 义 了 一 个 名 为 Stock 的 类 ， 在 之 后 的 第 5 行 到 第 16 行 中 通过 
def 定义 了 Stock 类 的 若干 个 方法 ， 请 注意 ， 在 这 些 方法 中 都 能 看 到 self 关键 字 。 

self 是 指 自身 类 , 这 里 即 是 指 Stock 类 , 比如 在 第 6 行 的 init 方 法 中 ,是 用 self stockCode, self price 
= stockCode.price 的 方式 , 用 参数 传 入 的 stockCode 和 price 给 类 的 对 应 属性 赋值 。 在 第 7 行 到 第 14 
行 的 get 和 set 类 方法 中 ， 用 参数 给 self 指向 的 本 类 的 对 应 属性 赋值 。 而 在 第 16 行 的 display 方法 
中 ， 通 过 print 语句 输出 了 本 类 中 的 两 个 属性 的 值 。 

在 第 18 行 中 定义 了 Stock 类 的 一 个 实例 对 象 myStock， 并 在 实例 化 时 ， 传 入 了 该 对 象 对 应 的 
两 个 属性 的 值 。 在 第 19 行 中 ,通过 myStock 这 个 实例 (请 注意 是 myStock 实例 ， 而 不 是 Stock 类 ) 
调用 了 display 方法 。 

请 注意 ， 调 用 方法 (或 函数 ) 的 主体 是 实例 ， 而 不 是 类 (Stock.display) ， 这 是 符合 逻辑 的 。 
比如 在 展示 股票 信息 时 ， 不 是 展示 抽象 的 股票 类 信息 〈 即 Stock 类 的 信息 ) ， 而 是 要 展示 具体 股票 
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实例 对 象 〈 比 如 600018) 的 信息 。 
在 第 21 行 和 第 23 行 中 通过 set 方法 变更 了 属性 值 ， 在 之 后 的 第 22 行 和 第 24 行 的 print 语句 
中 ， 是 通过 调用 get 方法 得 到 了 myStock 实例 中 的 值 。 


3.1.2 通过 _init_ 了解 常用 的 魔 木 方法 


在 刚才 的 范例 程序 中 看 到 了 一 个 现象 ， 在 通过 myStock = Stock("600018", 50) 实 例 化 一 个 股票 
对 象 时 ， 会 自动 触发 Stock 类 里 的 _init_ 方法 。 像 这 样 在 开头 和 结尾 都 是 两 个 下 画 线 的 方法 叫 魔 
术 方 法 ， 它 们 会 在 特定 的 时 间 点 被 自动 触发 ， 比 如 _init ”方法 会 在 初始 化 类 的 时 候 被 触发 。 

魔术 方法 虽然 不 少 , 但 在 实际 项 目 中 经 常 被 用 到 的 却 不 多 。 下 面 通过 MagicFuncDemo.py 范例 
程序 来 看 看 使 用 频率 比较 高 的 魔术 方法 。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 ”# 定义 类 

4 class Stock: 

5 def init (self,stockCode): 

6 Print("in init ") 

流 self.stockCode = stockCode 

8 # 回收 类 的 时 候 被 触发 

9 def del (self): 

10 print("In _del ") 

11 def “str (self): 

有 print("in _ str_") 

13 return "stockCode is: "+self.stockCode 

14 def _ repr__(self): 

15 return "stockCode is: "+self.stockCode 

16 def _setattr (self, name, value): 

Print("in _ setattr ") 

18 self. dict [name] = value # 给 类 中 的 属性 名 分 配 值 
9 def getattr (self, key): 

20 print("in setattr ") 

2 和 if key == "stockCode": 

22 return self.stockCode 

23 else: 

24 print ("Class has no attribute '%s'" % key) 
25 # 初始 化 类 ， 并 调用 类 里 的 方法 

26 myStock = Stock("600128") # 触发 init 和 setattr 方法 
27 print (myStock) # 触发 str 和 repr 方法 


28 myStock.stockCcode = "600020"  ## 触发 setattr 方法 


在 第 5 行 定义 的 _init_ 方 法 内 ， 在 第 26 行 创建 对 象 实例 时 会 被 触发 ， 这 里 的 _init 方法 只 
有 两 个 参数 , 而 前 一 节 的 范例 程序 中 有 3 个 。 事 实 上 , 该 方法 可 以 支持 多 个 或 多 种 不 同 参数 的 组 合 ， 
在 后 文 提 到 “ 重 载 ” (Overloaded) 概念 时 会 详细 介绍 。 

第 9 行 的 _del 方法 会 在 类 被 回收 时 触发 ， 它 有 些 像 析 构 函数 ， 可 以 在 范例 程序 中 使 用 打印 
语句 来 查看 类 的 回收 时 间 点 , 如 果 在 类 里 还 打开 了 文件 等 的 资源 , 也 可 以 在 这 个 方法 中 关闭 这 些 资 
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第 11 行 的 _str_ 和 第 14 行 的 _repr_ 方 法 一 般 会 配套 使 用 , 这 两 个 方法 是 在 第 27 行 被 触发 。 
当 调 用 print 方法 打印 对 象 时 , 首先 会 触发 _repr 方法 , 这 里 如 果 不 写 _str 方法 , 运行 时 会 报错 ， 
原因 是 在 print 方法 的 参数 里 传 入 的 是 myStock 对 象 ， 而 打印 时 ， 一 般 是 会 输出 字符 串 ， 所 以 这 里 
就 需要 通过 _str_ 方 法 定义 “把 类 转换 成 字符 串 打印 ”的 方法 ， 在 第 13 行 中 打印 stockCode 的 信 

相 比 之 下 ， 第 16 行 的 _setattr _ 和 第 19 行 的 _getattr_ 被 调用 的 频率 就 没有 之 前 的 方法 高 ， 
它们 分 别 会 在 设置 和 获取 属性 时 被 触发 。 它们 被 调用 的 频率 不 高 的 原因 是 , 一 般 在 代码 中 是 通过 诸 
如 get_price 和 set_price 的 方式 获取 和 设置 指定 的 属性 值 ， 而 在 设置 和 获取 属性 值 时 ， 一 般 无 需 执 
行 其 他 的 操作 ， 所 以 就 无 需 在 _ setattr _ 和 getattr _ 这 两 个 魔术 方法 里 编写 “自动 触发 ”的 操作 。 
出 于 同样 的 原因 ，_setitem 和 getitem ”这 两 个 魔术 方法 被 调用 的 频率 也 不 高 。 


3.1.3 ”对 外 屏蔽 类 中 的 不 可 见方 法 


出 于 封装 性 的 考虑 ， 类 的 一 些 方法 就 不 该 让 外 部 使 用 ， 比 如 启动 汽车 ， 就 应 该 使 用 提供 的 “用 
钥匙 发 动 ” 的 方法 启动 汽车 ， 而 不 该 通过 汽车 类 里 的 “连接 线路 启动 ”的 方法 来 启动 。 

出 于 同样 的 道理 ， 为 了 防止 误 用 ， 在 定义 类 时 ， 应 当 通 过 控制 访问 权限 的 方式 来 限制 某 些 方 
法 和 属性 被 外 部 调用 。 

在 Python 语言 中 ， 诸 如 _xx 这 样 以 单 下 画 线 开 头 的 是 protected ( 受 保护 ) 类 型 的 变量 和 方法 ， 
它们 只 能 在 本 类 和 子 类 中 访问 。 而 诸如 _xx 以 双 下 画 线 表 示 的 是 private( 私 有) 类 型 的 变量 和 方 
法 ， 它 们 只 能 在 本 类 中 被 调用 。 

下 面 通过 ClassAvailableDemo.py 范例 程序 来 演示 私有 变量 和 方法 的 使 用 或 调用 方式 ， 而 
protected 类 型 的 变量 和 方法 ， 将 在 介绍 “继承 ”章节 中 说 明 。 


1 # !/usr/bin/env python 

也 # coding=utf-8 

3 ”上 # 定义 类 

4 class Car: 

各 def _init__(self,owner,area): 
6 self.owner = owner 

7 self._ area = area 

8 def _ engineStart (self): 
9 print ("Engine Start") 
10 def start(self): 

dz Print("Start Car") 

12 self. engineStart() 
13 def get areal(self): 

14 return self. area 
15 def set areal(self,area): 
16 Self. area 三 axeal 
17 # 使 用 变量 


18 carForPeter = Car("Peter",'ShangHai') 
19 # print(carForPeter. area) 
20 print(carForPeter.owner) # Peter 
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21 carForPeter.set_area("HangZhou") 

22 print(carForPeter.get area()) # HangZzhou 
23 carForPeter.start() 

24 # carForPeter. engineStart()  ## 报错 

在 第 7 行 的 _init 方法 中 通过 输入 参数 给 self， area 变量 赋值 ， 这 里 的 _area 是 私有 变量 ， 
而 第 8 行 的 _engineStart 是 私有 方法 。 

这 些 私有 变量 只 能 在 Car 类 内 部 被 用 到 ， 如 果 去 除 第 19 行 的 注释 ， 程序 运行 就 会 出 错 ， 因 为 
企图 在 类 的 外 部 使 用 私有 变量 。 与 之 相 比 ， 由 于 owner 是 公有 变量 ， 因 此 通过 第 20 行 的 代码 直接 
在 类 的 外 部 通过 类 的 实例 来 访问 。 同 样 ， 如 果 去 掉 第 24 行 的 注释 ， 也 会 报错 ， 因 为 企图 通过 实例 
调用 私有 的 方法 。 

下 面 给 出 在 项 目 中 使 用 私有 变量 和 私有 方法 的 一 些 调用 准则 。 


(1) 一 定 要 把 不 该 让 外 部 看 到 的 属性 和 方法 设置 成 取 有 的 《或 受 保护 的 ) ， 比 如 上 述 范例 程 
序 第 8 行 的 _engineStart 属于 汽车 启动 时 的 内 部 操作 ,不 该 让 用 户 直接 调用 ,所 以 应 该 毫 不 犹豫 地 
设置 成 私有 。 

(2) 私有 的 或 受 保护 的 属性 , 应 该 通过 如 第 13 行 和 第 15 行 的 get 类 和 set 类 的 方法 供 外 部 调 
用 。 

(3) 应 该 尽 可 能 地 缩小 类 和 属性 的 可 见 范围 。 比 如 把 某 个 私有 方法 设置 成 公有 的 ， 这 在 语法 
上 不 会 有 错 ， 而 且 用 起 来 会 更 方便 ,因为 能 在 类 外 部 直接 调用 了 。 但 是 ,一旦 让 外 部 用 户 能 直接 调 
用 内 部 方法 ,就 相当 于 破坏 了 类 的 封装 特性 ， 很 容易 导致 程序 出 错 ， 所 以 上 述 “ 访 问 私有 变量 和 私 
有 方法 而 报错 ”的 特性 ， 其 实 是 一 种 保护 机 制 。 

(4) 如 果 没 有 特殊 理由 ， 一 般 都 是 把 属性 设置 成 私有 的 或 受 保护 的 ， 同 时 提供 公有 的 get 和 
set 类 方法 供 外 部 访问 ， 而 不 该 直接 把 属性 设置 成 公有 的 。 


3.1.4 ”私有 属性 的 错误 用 法 


可 以 这 样 说 , 初学 者 在 使 用 私有 变量 时 ,很 容易 出 现 如 下 PrivateBadUsage.py 范例 程序 中 所 示 
的 问题 。 


1 # !/usr/bin/env Python 

六 # coding=utf-8 

3 “## 定义 类 

4 class Car: 

3 def init (self,area): 
6 self. area = area 
def get areal(self): 

8 return self. area 

9 def set areal(lself,area): 
10 self. area = area 
11 # 使 用 类 


12 carForPeter = Car("ShangHai") 

13 carForPeter. area="HangZzhou" 

14 print(carForPeter.get area()) # 发 现 并 没 改变 area 
15 carForPeter.set area("WuXi") 
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16 print(carForPeter.get area()) # WUXi 
17 carForPeter. Car area="Bad Usage" # 不 建议 这 样 做 
18 print(carForPeter.get area()) # 发 现 修改 了 __area 的 值 


在 这 个 范例 程序 的 第 6 行 中 ， 在 _init_ 的 初始 化 方法 内 ， 给 ”area 这 个 私有 变量 赋值 ， 同 时 
在 第 7 行 和 第 9 行 中 ， 定 义 了 针对 该 私有 属性 的 get 和 set 方 法。 

在 第 13 行 中 , 看 上 去 是 直接 通过 carForPeter 对 象 给 ”area 私有 变量 赋值 ， 但 这 里 有 两 点 出 平 
我 们 的 意料 : 第 一 ， 明 明 不 能 在 外 部 直接 访问 私有 变量 ， 为 什么 这 行 代码 运行 时 没 报错 呢 ? 第 二 ， 
通过 第 14 行 的 代码 打印 carForPeter.get_area() 的 值 ， 发 现 carForPeter 内 部 的 _area 变量 依然 是 
ShangHai， 没 有 变 成 HangZhou。 

原因 很 简单 ， 在 实例 化 对 象 的 时 候 ，Python 会 把 类 的 私有 变量 改 个 名 字 ， 该 名 字 的 规则 如 第 
17 行 所 示 ， 是 类 名 加 上 私有 变量 名 。 也 就 是 说 ， 前 面 定 义 的 私有 变量 被 转换 成 _Car_area， 而 在 
第 13 行 中 ， 是 在 carForPeter 这 个 对 象 里 新 建 了 一 个 属性 _area， 并 给 它 赋 了 HangZhou 这 个 值 ， 
因此 在 第 13 行 中 没有 对 Car 类 的 私有 变量 _area 进行 修改 。 

在 第 17 行 中 ， 进 一 步 验证 了 “对 私有 变量 进行 改名 ”的 这 个 规则 ， 这 里 给 _Car_area 变量 赋 
予 了 一 个 新 的 值 ， 在 项 目 中 不 建议 这 样 做 ， 应 该 通过 对 应 的 get 和 set 方法 操作 私有 属性 。 第 18 行 
中 的 输出 结果 是 Bad Usage， 由 此 验证 了 _Car area 变量 确实 对 应 到 Car 内 部 私有 的 _area， 也 就 
是 说 验证 了 Python 对 私有 变量 的 “更 名 规则 ”。 

最 后 要 强调 的 是 ， 本 节 讲 述 了 私有 变量 的 更 名 规则 ， 目 的 不 是 让 大 家 通过 变更 后 的 名 字 来 访 
问 私有 变量 , 而 是 让 大 家 了 解 这 个 技术 细节 ， 从 而 避免 上 述 似是而非 的 使 用 私有 属性 的 不 规范 和 不 
建议 的 用 法 。 


3.1.5 ”静态 方法 和 类 方法 


前 文 介绍 了 通过 对 象 .方法 0 的 形式 来 调用 方法 ， 比 如 张 三 . 吃 饭 0， 而 不 是 人 类 .吃饭 0， 因 为 吃 
饭 的 主体 是 具体 的 某 个 人 ， 而 不 是 抽象 的 人 类 概念 。 但 是 ,在 一 些 应 用 场景 里 ， 无 需 实例 化 对 象 就 
可 以 调用 方法 。 

比如 在 提供 计算 功能 的 工具 类 里 ， 类 本 身 即 可 当成 “计算 工具 ”， 再 实例 化 对 象 就 没 意 义 了 ， 
对 于 这 种 情况 就 可 以 通过 定义 静态 方法 和 类 方法 来 简化 调用 过 程 。 

在 Python 语言 中 ， 类 方法 (classmethod) 和 静态 方法 (staticmethod) 的 差别 是 ， 类 方法 的 第 
一 个 参数 必须 是 指向 本 身 的 引用 ， 而 静态 方法 可 以 没有 任何 参数 。 在 下 面 的 MethodDemo.py 范例 
程序 中 来 看 一 下 两 者 的 常见 用 法 。 


# !/usr/bin/env Python 
# coding=utf-8 
class CalculateTool: 
ET = 34 
@staticmethod 
def add (x,y): 
result = xty 
printls + wy) 
@classmethod 
def calCirclel(self,r): 
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11 print(self. PI*r*r) 
12 CalculateTool.add(23, 22) # 输出 45 
13 CalculateTool.calCircle(1) # 输出 3.14 


14”# 不 建议 通过 对 象 访问 静态 方法 和 类 方法 
15 tool = CalculateTool () 

16 tool.add(23，22) 

17 tool.calCircle(1) 


在 第 6 行 的 add 方法 前 面 加 了 @staticmethod 注解 ， 用 来 说 明 这 个 方法 是 静态 方法 ， 而 给 第 10 
行 的 calCircle 方法 在 第 9 行 如 了 @classmethod 注解 ， 说 明 这 个 方法 是 类 方法 。 

在 add 这 个 静态 方法 中 , 由 于 没有 通过 self 之 类 的 参数 来 指向 本 身 , 因此 它 不 能 访问 类 的 内 部 
属性 和 方法 ， 而 对 于 calCircle 这 个 类 方法 而 言 ， 由 于 第 一 个 参数 self 指向 类 本 身 ， 因 此 能 访问 类 
的 变量 PI。 在 第 12 行 和 第 13 行 中 ， 通 过 类 名 CalculateTool 来 直接 访问 静态 方法 和 类 方法 ， 这 里 
不 建议 使 用 第 15 行 到 第 17 行 的 方式 ， 即 不 建议 通过 对 象 来 访问 静态 方法 和 类 方法 。 

需要 强调 的 是 ， 静 态 方法 和 类 方法 会 破坏 类 的 封装 性 ， 那 么 无 需 实例 化 对 象 即 可 访问 ， 所 以 
使 用 时 请 慎重 ， 确 实 有 “无 需 实例 化 对 象 ”的 需求 时 ， 才 能 使 用 。 


3.2 ”通过 继承 扩展 新 的 功能 


通过 继承 可 以 复 用 已 有 类 的 功能 ， 并 可 以 在 无 需 重新 编写 原来 功能 的 基础 上 对 现 有 功能 进行 
扩展 。 在 实际 应 用 中 ， 会 把 通用 性 的 代码 封装 到 父 类 ， 通 过 子 类 继承 父 类 的 方式 优化 代码 的 结构 ， 
避免 相同 的 代码 被 多 次 重复 编写 。 


3.2.1 继承 的 常见 用 法 


继承 的 语法 是 在 方法 名 后 加 个 括号 ， 在 括号 中 写 要 继承 父 类 的 名 字 。 在 Python 语言 中 ， 由 于 
object 类 是 所 有 类 的 基 类 ， 因 此 如 果 定 义 一 个 类 时 没有 指定 继承 哪个 类 ， 就 默认 继承 object 类 。 在 
下 面 的 InheritanceDemo.py 范例 程序 中 演示 了 继承 的 一 般 用 法 。 


# !/usr/bin/env python 
# coding=utf-8 
class Employee (object): # 定义 一 个 父 类 
def _ init (self,name): 
self. name = name 
def get name (self): 
return self. name 
def set name(self,name): 
self._ name = name 
def login (self) : # 父 类 中 的 方法 
print ("Employee In Office") 
def changeSalary (self,newSalary): 
self. salary = newSalary 
def get Salary(self): 
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第 3 章 Python 面向 对 象 程序 设计 思想 的 实践 | 39 


5 return self. salary 
16 ”# 定义 一 个 子 类 ,继承 Employee 类 
17 class Manager (Employee): 


18 def login(self): # 在 子 类 中 覆盖 父 类 的 方法 

19 print ("Manager In Office") 

20 print ("Check the Account List") 

安 主 def attendWeeklyMeeting (self): 

22 Print ("Manager attend Weekly Meeting") 

23 # 使 用 类 

24 manager = Manager ("Peter") 

25 print (manager.get name()) # Peter 

26 manager.login() # 调用 子 类 的 方法 ,Manager In Office 


27 manager.changeSalary(30000) 
28 Pprint(manager.get Salary()) # 30000 
29 manager.attendWeeklyMeeting() 

在 第 3 行 中 定义 了 名 为 Employee 的 员工 类 ， 同 时 指定 它 继承 自 默 认 的 object 类 ， 事实 上 ， 这 
句 话 等 同 于 class Employee(0)。 在 这 个 父 类 里 ， 定 义 了 员工 类 的 通用 方法 ， 比 如 在 第 4 行 定义 的 构 
造 函 数 中 设置 了 员工 的 名 字 , 在 第 6 行 和 第 8 行 开 始 分 批 定义 了 获取 和 设置 名 字 属 性 的 方法 , 在 第 
12 行 和 第 14 行 分 别 定义 了 更 改 和 获取 工资 的 方法 。 
正 是 因为 在 Employee 父 类 中 封装 了 诸如 设置 工资 等 的 通用 性 方法 , 所 以 子 类 Manager 里 的 代 
码 就 相对 简单 。 具 体 来 说 ， 在 第 17 行 定义 Manager 类 时 ， 是 通过 括号 的 方式 指定 该 类 继承 自 
Employee 类 ， 在 其 中 可 以 复 用 父 类 公有 的 和 受 保护 的 方法 。 此 外 ， 在 第 18 行 中 覆盖 (也 叫 覆 写 或 
重 写 ) 了 父 类 中 的 login 方法 ， 并 在 第 21 行 定义 了 专门 针对 子 类 的 attendWeeklyMeeting 方法 。 

在 第 24 行 中 实例 化 了 一 个 名 为 manager 对 象 , 因为 在 Manager 子 类 里 没 定义 _init_ 方 法, 所 
以 这 里 调用 的 是 父 类 Employee 里 的 _init_ 方 法， 可 从 第 25 行 的 打印 语句 中 看 到 。 同 样 ， 在 第 27 
和 第 28 行 中 ，manager 对 象 也 复 用 了 定义 在 父 类 〈 即 Employee 类 ) 里 的 方法 。 

从 第 26 行 login 方法 的 打印 结果 来 看 ， 这 里 执行 的 是 子 类 里 的 login 代码 ， 这 说 明 如 果子 类 覆 
盖 了 父 类 的 方法 ， 那 么 最 终 会 执行 子 类 的 方法 。 

在 第 29 行 中 , 调用 了 子 类 特有 的 attendWeeklyMeeting 方法 , 结果 会 毫 无 疑问 地 输出 “Manager 
attend Weekly Meeting”。 


3.2.2” 受 保护 的 属性 和 方法 


在 3.2.1 小 节 的 范例 程序 中 ， 除 了 在 父 类 中 用 到 了 __name 这 个 私有 变量 外 ， 还 用 到 了 带 一 个 
下 画 线 的 _salary 受 保护 的 变量 ， 而 带 一 个 下 画 线 开 头 的 方法 叫 受 保护 的 方法 。 这 类 受 保护 的 属性 
和 方法 能 在 本 类 和 子 类 中 被 用 到 。 在 下 面 的 ProtectedDemo.py 范例 程序 中 来 看 一 下 如 何 合理 地 使 用 
受 保护 的 属性 和 方法 。 
和 # !/usr/bin/env Python 
# coding=utf-8 
3 class Shape: # 定义 父 类 
4 _size=0 # 受 保护 的 属性 
和 def init (self,type,size): 
6 self. type = type 
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了 self. size = Size 

8 def _set type(self,type):  # 受 保护 的 方法 

9 self. type=type 

10 def get type(self): # 受 保护 的 方法 

下 下 return self. type 

12 class Circle (Shape) : # 定义 子 类 

3 def set size(self,size) : 

14 self. size = size # 覆盖 了 父 类 的 _size 属性 
15: def PrintSize(self) : 

16 Print(self. size) 

17 class anotherClass: # 定义 不 相干 的 一 个 类 

18 pass # 如 果 是 空 方法 ， 则 需要 加 个 pass， 否 则 会 报错 
19 # 使 用 子 类 


20 c=Circle("Square",2) 

21 c¢c. set type("Circle") 

22 Print(c. get type()) 

23 c.printSize() 

24 anotherClass. set type("Circle") # 会 报错 

在 第 3 行 开始 定义 父 类 Shape 的 部 分 ， 在 其 中 的 第 4 行 定义 了 名 为 _size 的 受 保护 的 属性 ， 同 
时 在 第 8 行 和 第 10 行 中 定义 了 两 个 以 单 下 画 线 开头 的 受 保护 的 方法 。 在 第 12 行 开始 定义 Shape 
类 的 子 类 Circle 部 分 ， 在 其 中 的 第 14 行 和 第 16 行 用 到 了 父 类 定义 的 _size 这 个 受 保护 的 变量 。 

由 于 受 保护 的 变量 能 在 本 类 和 子 类 里 被 使 用 ， 因 此 在 第 20 行 初始 化 子 类 时 ， 其 实 是 用 子 类 的 
_size 覆盖 掉 了 父 类 的 _size， 同 时 ， 在 第 21 行 和 第 22 行 的 调用 中 ， 我 们 可 以 看 到 子 类 能 调用 父 类 
中 受 保护 的 方法 。 但 是 要 注意 的 是 ， 受 保护 的 方法 不 能 在 非 子 类 中 被 调用 ， 比 如 在 第 24 行 中 ， 因 
为 anotherClass 不 是 Shape 的 子 类 ， 所 以 调用 _set_type 时 会 报错 。 

前 文 讲 述 过 ， 需 要 把 仅 在 本 类 里 用 到 的 属性 和 方法 封装 成 私有 的 ， 基 于 “封装 ”特性 的 同样 
考虑 ， 这 里 的 “获取 和 设置 形状 种 类 ”的 方法 ， 它 的 有 效 范 围 是 在 “形状 基 类 ”和 对 应 的 子 类 里 ， 
而 其 他 的 类 不 该 调用 它们 ， 因 此 对 于 这 类 的 属性 和 方法 ， 就 不 应 该 定义 成 “公有 的 ”， 而 应 该 定义 
成 “ 受 保护 的 ”。 


3.2.3 慎 用 多 重 继承 


在 Java 等 语言 中 ， 一 个 类 只 能 继承 一 个 父 类 ， 这 叫 “ 单 一 继承 ”。 但 在 Python 语言 中 ， 一 个 
子 类 可 以 继承 多 个 父 类 ， 这 叫 “ 多 重 继承 ”。 

这 种 做 法 看 似 提供 了 很 大 的 便利 ， 但 如 果 项 目 里 的 代码 量 很 多 ， 使 用 多 重 继承 会 增加 代码 的 
维护 成 本 ， 所 以 如 果 没 有 特殊 需求 ， 最 好 只 使 用 “单一 继承 ”， 而 不 要 使 用 “多 重 继承 ”。 在 下 面 
的 MoreParentsDemo.py 范例 程序 中 ， 我 们 来 看 一 下 多 重 继承 带 来 的 困惑 。 

1 # !/usr/bin/env Python 

有 # coding=utf-8 

3 class FileHandle (object) : # 处 理 文件 的 类 
4 def readl(self,path): 

吧 print ("Reading File") 

6 # 读 文 件 
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了 def writel(self,path,value): 
8 _ path = path 

9 print ("Writing File") 

10 # 写 文 件 

11 class DBHandle (object) : # 处 理 数据 库 的 类 
2 def read(self,pPath) : 

1 print ("Reading DB") 

14 # 读数 据 库 

i def writel(self,path,value): 
16 _ Path = path 

Ey print ("Writing DB") 

18 # 写 数据 库 


19 # Tool 同时 继承 了 两 个 类 

20 # class Tool (FileHandle,DBHandle): 
21 class Tool (DBHandle,FileHandle): 
22 def businessLogic(self) : 

23 Print("In Tool") 

24 tool = Tool() 

25° toolsread("o Nl tzt") 


在 第 3 行 和 第 11 行 的 FileHandle 和 DBHandle 这 两 个 类 中 ， 都 定义 了 read 和 write 这 两 个 方 
法 ， 且 它们 的 参数 相同 。 在 第 21 行 中 的 Tool 类 同时 继承 了 这 两 个 类 ， 请 注意 第 20 行 和 第 21 行 代 
码 的 差别 ， 它 们 在 继承 两 个 父 类 时 ， 次 序 有 差别 。 

如 果 在 多 重 继 承 时 改变 了 继承 的 次 序 ， 那 么 通过 第 25 行 的 输出 语句 ， 会 发 现 前 面 的 类 方法 会 
覆盖 掉 后 面 类 的 同名 方法 ， 比 如 当前 打印 时 ， 会 输出 Reading DB。 这 是 因为 DBHandle 类 的 read 
方法 会 覆盖 掉 FileHandle 类 的 同名 方法 。 

如 果 注 释 掉 第 21 行 的 代码 ， 同 时 去 除 调 第 20 行 的 注释 ， 就 会 发 现 输出 的 是 Reading File。 这 
是 因为 ,在 第 20 行 的 代码 中 ,多 重 继承 的 次 序 是 先 FileHandle 再 DBHandle， 于 是 FileHandle 类 的 
read 方法 会 覆盖 掉 DBHandle 类 的 同名 方法 。 

如 果 我 们 的 本 意 是 通过 多 重 继承 同时 在 Tool 引入 读 写 文件 和 数据 库 的 方法 ,但 从 效果 上 来 看 ， 
由 于 两 个 父 类 中 的 方法 同名 了 ， 出 现 方法 的 覆盖 了 ， 因 此 就 和 我 们 使 用 多 重 继承 的 本 意 不 符 了 。 

遇 到 这 类 情况 ， 如 果 还 要 继续 使 用 多 重 继承 ， 那 么 就 不 得 不 改变 其 中 一 个 类 的 方法 名 ， 但 这 
样 会 增加 代码 的 维护 难度 ， 与 其 这 样 ， 就 不 如 不 用 多 重 继承 ， 从 根本 上 来 避免 这 类 困惑 。 


3.2.4 通过“ 组合” 来 避免 多 重 继承 


在 多 重 继承 的 范例 中 ， 想 要 通过 继承 多 个 类 在 本 类 中 引入 多 个 功能 。 如 果 在 这 类 应 用 场景 中 ， 
子 类 和 父 类 之 间 没 有 从 属 关 系 ， 就 不 该 用 继承 ， 应 该 用 “组 合 ”， 即 在 一 个 类 中 组 合 多 个 类 ， 从 而 
引入 其 他 类 提供 的 方法 。 在 下 面 的 CompositionDemo.py 范例 程序 中 来 看 一 下 “组 合 ”多 个 类 的 用 
# !/usr/bin/env Python 
# coding=utf-8 
# 省 略 原来 定义 的 FileHandle 和 DBHandle 代码 
# 改写 后 的 Tool 类 


心 w N 
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> class Tool (object) : 

6 def init (self,fileHandle): 

i self.fileHandle = fileHandle 
8 self.dbHandle = DBHandle() 


9 def calDataInFile(self,Path) : 
10 self.fileHandle.read (path) 
本 # 统计 文件 里 的 数据 

2 def calDataInDB (self,path): 
13 self.dbHandle.read (path) 
14 # 统计 文件 里 的 数据 

15 # 使 用 类 


16 fileHandle = FileHandle() 
17 tool = Tool (fileHandle) 
18 tool.calDataInFile("c:\\1.txt") # 输出 Reading File 
19 tool.calDataInDB ("localhost:3309/myDB") # 输出 Reading DB 

在 第 5 行 定义 的 Tool 的 _init_ 方法 中 ,通过 两 种 方式 引入 了 FileHandle 和 DBHandle 这 个 类 : 
第 一 种 方式 是 在 第 6 行 中 ， 通 过 输入 参数 传 入 FileHandle 类 型 的 对 象 ， 第 二 种 方式 是 直接 在 第 8 
行 中 生成 DBHandle 类 型 的 对 象 。 通 过 这 两 种 方式 在 Tool 类 中 “组 合 ”两 个 工具 类 后 ， 即 可 在 第 
10 行 和 第 13 行使 用 。 

在 第 18 行 和 第 19 行 调用 tool 对 象 的 两 个 方法 时 ， 就 会 发 现 没有 再 出 现 之 前 看 到 的 “方法 被 
覆盖 ”的 现象 ,通过 输出 结果 可 以 看 到 ， 在 Tool 中 正确 地 调用 到 了 读 写 文件 和 读 写 数 据 库 的 方法 。 


3.3 ”多 态 是 对 功能 的 抽象 


多 态 的 含义 是 ， 实 现 同 一 个 功能 的 方法 可 以 有 不 同 的 表现 形态 。 在 实际 应 用 中 往往 会 整合 性 
地 使 用 “继承 ”和 “多 态 ” 这 两 大 特性 。 

如 果 两 个 方法 同名 ， 但 参数 个 数 不 同 ， 这 在 Java 等 语言 里 是 允许 的 ， 但 在 Python 语言 中 不 支 
持 ， 所 以 多 态 特 性 在 Python 中 的 表现 形式 是 ， 方 法 同名 但 参数 类 型 不 同 ， 或 者 同一 个 方法 能 适用 
于 不 同类 型 的 调用 场景 。 


3.3.1 ”Python 中 的 多 态 特 性 


在 前 文 提 到 过 多 态 特性 ， 下 面 通过 PolyDemo.py 范例 程序 从 一 些 熟悉 的 程序 语句 中 来 归纳 一 
下 “多 态 ” 的 具体 表现 方式 。 


# !/usr/bin/env python 

# coding=utf-8 

print (1+1) # 输出 是 1 
print ("1"+"1") # 输出 是 11 


areaList=["ShangHai","HangZzhou"] 
Print (areaList) # print 能 适用 于 不 同类 型 的 参数 


print ("abc".index("a")) 


JonOGODOPp 


第 3 章 Python 面向 对 象 程序 设计 思想 的 实践 | 43 


8 


print(["a" "Db "oe"l.index("D®")) 


从 第 3 行 和 第 4 行 的 程序 语句 ， 可 以 看 到 对 于 同一 种 运算 符 〈 即 同一 种 功能 ) 加 号 ， 当 参数 
(或 操作 数 ) 不 同时 , 会 执行 不 同 的 操作 。 比 如 参数 是 数字 时 , 会 执行 加 法 操作 ,如 果 是 字符 串 时 ， 
会 执行 字符 串 的 连接 操作 。 另 外 ， 对 于 同一 个 方法 print， 当 参数 不 同时 (参数 分 别 是 数字 类 型 和 
字符 串 类 型 ) ， 也 会 执行 不 同 的 操作 ， 即 输出 数字 类 型 和 字符 串 类 型 的 对 象 。 
这 就 是 多 态 特 性 的 具体 表现 方式 ， 即 同一 种 功能 ， 比 如 上 面 范例 程序 中 的 print 方法 ， 随 着 输 
入 参数 类 型 的 不 同 ， 会 有 不 同 的 表现 形态 ， 即 能 输出 整数 类 型 或 字符 串 类 型 。 


在 第 7 行 和 第 8 行 中 ， 可 以 看 到 index 方法 会 随 着 调用 主体 的 不 同 ， 


展现 出 不 同 的 形态 ， 比 如 


在 第 7 行 中 ,会 从 字符 串 里 找到 单词 的 索引 值 ， 而 在 第 8 行 中 ， 是 从 列表 里 找 单词 的 索引 值 ， 这 也 
体现 了 多 态 的 特性 。 


3.3.2 ”多 态 与 继承 结合 


多 态 往 往 会 和 继承 结合 使 用 ， 即 当 一 个 父 类 的 不 同 子 类 调用 同一 个 方法 时 ， 该 方法 会 有 不 同 
的 表现 形式 。 在 下 面 的 PolyInhertanceDemo.py 范例 程序 中 可 以 看 到 整合 多 态 和 继承 这 两 者 的 用 法 。 


oamwmwwm 


# !/usr/bin/env Python 
# coding=utf-8 
class Employee (object): 
def _init_ (self,name): 
self._name = name 
def work(self): 
Print(self. name + " Work.") 
class Manager (Employee): 
def init (self,name): 
self. name = name 
def check (self) : 
print ("Manage check work.") 
def work (self) : 
print(self. name + " Work.") 
self.check() 
class HR(Employee): 
def _init__ (self,name): 
self._ name = name 
def calSalary (self): 
print ("HR calculate Salary.") 
def work(self): 
print(self. name + " Work.") 
self.calSalary() 
# 调用 类 
manager = Manager ("Peter") 
manager .work () 
hr = HR("Mike") 
hr.work() 


第 8 行 的 Manager 类 和 第 16 行 的 HR 类 都 是 Employee 的 子 类 ,在 其 中 都 有 work 方法, 但 在 
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不 同 的 子 类 里 ，work 方法 有 不 同 的 功能 ， 即 表现 形式 不 同 。 

第 25 行 和 第 27 行 的 程序 语句 分 别 创建 了 Manager 和 HR 这 两 个 类 的 对 象 ， 虽 然 它 们 都 是 
Employee 的 子 类 ， 但 在 第 26 行 和 第 28 行 调 用 其 中 的 work 方法 时 ， 能 根据 调用 主体 的 不 同 ， 分 别 
调用 对 应 类 的 work 方法 ， 下 面 的 输出 语句 即 可 验证 出 这 一 效果 。 

Peter Work. 

Manage check work. 


Mike Work. 
HR calculate Salary. 


3.4 通过 import 复 用 已 有 的 功能 


Python 语言 是 面向 对 象 的 程序 设计 语言 所 以 提供 了 以 “模块 ”(Module) 、“ 包 ”(Package) 
和 “ 库 ” 等 不 同形 式 的 程序 复 用 功能 。 在 编程 时 若 需 要 实现 某 项 功能 ， 可 以 优先 考虑 通过 import 
语句 导入 已 有 的 比较 成 熟 的 功能 模块 ， 而 不 是 从 头 开 始 开发 。 注 : Python 语言 也 被 称 为 “胶水 ” 
语言 ， 有 很 多 开源 模块 都 可 以 通过 import (导入 或 引入 ) 到 程序 项 目 中 来 加 快 项 目的 实现 ， 这 些 模 
块 一 般 称 为 包 或 程序 包 ， 也 被 称 为 库 。 本 书 大 部 分 地 方 都 统一 称 这 些 模块 或 包 为 “ 库 ”。 在 本 书 的 
行文 中 ， 在 单独 说 明 库 名 时 ， 库 名 的 第 一 个 英文 字母 都 大 写 ， 而 在 范例 程序 中 用 import 导入 库 时 ， 
还 要 遵照 库 的 原始 名 字 中 的 英文 字母 大 小 写 ， 和 否则 无 法 正确 导入 。 


3.4.1 通过 import 导入 现 有 的 模块 


Python 的 模块 是 一 个 扩展 名 为 py 的 Python 文件 ， 在 模块 中 可 以 封装 方法 、 类 和 变量 。Python 
中 的 模块 分 为 三 种 : 自 定义 模块 、 内 置 标准 模块 和 第 三 方 提供 的 开源 模块 。 
通用 性 的 方法 、 类 和 属性 往往 会 被 封装 到 模块 中 ， 这 样 就 能 达到 “一 次 编写 多 次 调用 ”的 效 
果 ， 而 无 需 在 每 个 调用 类 中 重复 编写 。 在 下 面 的 ModuleDemo.py 范例 程序 中 演示 了 定义 模块 的 常 
规 方法 。 
# !/usr/bin/env python 
# coding=utf-8 
def displayModuleName () : 
print ("CalModule") 
def add (x,y): 
return x+y 
def minus (x,y): 
return x-y 
9 PI = 3.14 # 封装 变量 
10 class Stock: 


oaowm 必 wwN 


了 于 def init (self, stockCode,price): 
2 self.stockCode, self.price = stockCode,price 
i3 def buy(self) : 


14 Print("Buy " + self.stockCode + " with the price:" + self.price) 
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在 第 3 行 到 第 8 行 中 定义 了 多 个 方法 ， 在 第 9 行 中 定义 了 PI 这 个 变量 ， 而 在 第 10 行 到 第 14 
行 定义 了 一 个 Stock 类 。 在 模块 中 一 般 放 的 是 “定义 ”类 的 代码 ， 而 不 会 放 “ 调 用 ”类 的 代码 。 
定义 好 模块 后 ， 就 可 以 在 其 他 Python 文件 中 通过 import 来 导入 定义 好 的 现 有 模块 ， 并 使 用 其 
中 的 功能 ， 如 下 ImportDemo.py 范例 程序 所 示 。 
# !/usr/bin/env Python 
# coding=utf-8 
import ModuleDemo as tool 
from ModuleDemo import Stock as stockTool 


Print (tool .PI) 当 3 

Print (tool.add (1,2)) | 

print (tool.minus(1,2)) # -1 

9 tool.displayModuleName() # CalModule 

10 #stockTool.add(1,2) # 出 错 

11 myStockTool = stockTool("600001","10") 

12 myStockTool.buy() #Buy 600001 with the price:10 


在 类 中 导入 模块 的 方式 一 般 有 两 种 : 第 一 种 如 第 3 行 所 示 ， 通 过 import 语句 和 模块 名 导入 指 
定 的 模块 ， 并 在 as 之 后 给 这 个 模块 起 个 别名 ; 另 一 种 方式 是 只 导入 该 模块 中 指定 的 内 容 ， 如 第 4 
行 所 示 ， 通 过 from 模块 名 import 类 名 (或 方法 名 或 属性 名 ) 的 方式 导入 指定 的 内 容 ， 在 as 之 后 
同样 可 以 起 个 别名 。 

导入 模块 或 指定 内 容 后 ， 在 第 6 行 到 第 9 行 中 ， 即 可 通过 tool 这 个 别名 访问 模块 中 的 属性 和 
方法 。 由 于 stockTool 这 个 别名 仅仅 是 指向 模块 中 的 Stock 类 ， 因 此 通过 它 无 法 调用 到 add 方法 ， 
而 只 能 如 第 11 行 和 第 12 行 所 示 ， 调 用 Stock 类 中 的 方法 。 


oamwmwewmP 


3.4.2 ” 包 是 模块 的 升级 


如 果 以 模块 的 形式 复 用 代码 出 现 了 模块 冲突 的 情况 ， 则 无 法 导入 实现 功能 不 同 但 名 字 相同 的 
模块 ， 为 了 解决 这 个 问题 ， 可 以 用 包 的 形式 来 复 用 现 有 功能 。 
从 表现 形式 上 来 看 ， 包 是 一 个 目录 ， 其 中 包含 若干 个 扩展 名 为 .py 的 模块 ， 而 且 包 里 还 得 包含 
一 个 _init_.py 的 文件 ， 哪 怕 这 个 文件 是 空 的 也 行 。 这 样 就 可 以 通过 “ 包 名 . 模块 名 ”的 方式 来 复 
用 模块 ， 从 而 能 避免 模块 冲突 的 情况 。 
下 面 来 实践 一 下 。 按 照 如 下 步骤 来 创建 一 个 包 , 在 charter3 的 项 目 中 , 新 建 一 个 名 为 myPackage 
的 目录 ， 随 后 在 其 中 放 入 如 图 3-1 所 示 的 文件 。 
日 区 charter3 
日 车 rc 
日 贾 nyPackage 
薪 _init_.py 
由 - 回 CalModuleDemo. py 
由 -加 NoduleDemo. py 


图 3-1 包 组 织 结构 的 示意 图 


_init _.py 文件 是 每 个 包 所 必 有 的 , 否则 会 出 错 ,这 里 仅 是 个 空 文件 。 范 例 程序 ModuleDemo.py 
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在 3.5.1 小 节 已 经 给 出 ， 新 加 的 CalModuleDemo.py 模块 代码 如 下 : 
# !/usr/bin/env Python 


# coding=utf-8 
E= 2.718 
G= 9.8 


def calGravity (m): 

return m*G 
在 第 3 行 和 第 4 行 定义 了 两 个 变量 , 而 在 第 5 行 中 封装 了 calGravity 方法 ,这 样 , 在 myPackage 
这 个 包 中 放 入 一 个 _init_.py 类 。 

随后 在 charter3 项 目 中 新 建 一 个 名 为 UsePackageDemo.py 的 文件 , 在 其 中 调用 包 中 的 模块 , 代 
码 如 下 。 


au 必 wN 


1 # !/usr/bin/env Python 
2 # coding=utf-8 
3 import myPackage.CalModuleDemo as calTool 
4 from myPackage import ModuleDemo as myTool 
5 Print (myTool .PI) | 
6 Pprint (calTool.calGravity(10)) # 98.0 
2 print (calTool.E) 人 
请 注意 第 3 行 和 第 4 行 导入 包 中 模块 的 方式 ， 在 第 3 行 是 通过 “ 包 名 .模块 名 ”的 方式 导入 
CalModuleDemo 这 个 模块 ， 而 在 第 4 行 则 是 通过 “from 包 名 import 模块 名 ”的 方式 导入 模块 。 
导入 后 ， 则 可 以 如 第 5 行 到 第 7 行 所 示 ， 通 过 “别名 . 属性 ”和 “别名 .方法 名 ”的 方式 来 调用 。 


3.4.3 ”导入 并 使 用 第 三 方 库 NumPy 的 步骤 


Python 中 的 模块 (Module) 和 包 〈Package) 都 能 被 称 为 “ 库 ”， 在 实际 的 项 目 中 ， 很 多 时 候 
是 通过 导入 第 三 方 库 ， 也 就 是 复 用 库 中 封装 的 诸多 功能 。 为 了 全 书 名 称 的 统一 ， 后 面 提 及 第 三 方 模 
块 或 包 的 时 候 ， 都 统一 称 为 库 。 单 独 提 及 库 名 的 时 候 ， 库 名 的 第 一 个 英文 字母 都 用 大 写 ， 在 程序 代 
码 中 用 import 导入 库 或 程序 语句 中 特 指 库 名 称 时 ， 则 回归 库 名 原始 的 英文 名 称 大 小 写 习惯 。 

比如 之 前 用 到 的 列表 等 功能 类 即 是 封装 在 Python 标准 库 中 的 ， 在 本 书 之 后 的 篇 幅 中 还 会 用 到 
一 些 开源 库 。 下 面 将 以 NumPy 这 个 开源 的 科学 计算 库 为 例 ， 演 示 一 下 导入 并 使 用 第 三 方 库 的 具体 
步骤 。 


301 由 于 我 们 安装 的 是 python3.4.4 版 本 ， 因 此 在 Scripts 目录 中 能 看 到 pip.exe， 如 图 3-2 


四 银 - 加 -让 万 中 语 xHx 国 - 


文件 和 文件 夹 任务 [用 闻 让， istaa-s 学 曾 | .instaa ee。 了 证 | as 多 sa es Af is. os 
因 部 兴 一 个 新 文件 天 


3-2 pip.exe 所 在 的 文件 夹 
请 确保 在 环境 变量 的 Path 里 ， 已 经 设置 了 pip.exe 所 在 的 路 径 D:\Python34\Scriptso 
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0 在 “命令 提示 符 ” 窗 口中 , 执行 命令 pip install -U numpy， 其 中 -U 表示 以 当前 用 户 的 


身份 安装 ， 安 装 好 以 后 ， 会 告知 安装 到 了 哪个 路 径 。 


并 在 “Interpreter- Python ”这 个 选项 中 ,在 System PATHONPATH 框 内 ， 单 击 “New Folder” 按 钮 ， 
而 后 添加 NumPy 库 的 安装 路 径 ， 如 图 3-3 所 示 ， 这 样 在 项 目 中 就 可 以 调用 NumpPy 库 中 的 方法 或 函 


数 了 。 
Python Interpreters > 
Python interpreters (e.g : python. exe) 
Nane Location CT 
加 python3.4.4 D:\Python34\python. exe 
Auto Config 


ov auwm 必 wm 


本 303 依次 单 击 ^Window "一 “Preferences" 菜单 ,在 随后 弹出 的 对 话 框 的 左 侧 , 找到 PyDev， 


Remove 


BM Libraries Forced Builtins | Predefined| Ba Enviroment | ® String Substitution Yariables 
System PYTHONPATH 


Systen Libs, Now Folder 


到 D:\Python34\DLLs 
男 D:\Python34\lib New Ege/Zipls) 
曾 D:\Python34 

而 D:\Fython34\lib\site-packages [ ameo。 ] 


户 C:\Documents and Settings\Administrator\Application Data\Python\Python34\site-packages\nunpy 


图 3-3 设置 NumPy 安装 所 在 的 路 径 


完成 上 述 步骤 后 , 就 可 以 调用 NumPy 库 中 的 方法 了 , 范例 程序 NumpyDemo.py 中 的 代码 如 下 。 


# !/usr/bin/env Python 

# coding=utf-8 

import numpy as np # 导入 NumPy 库 ， 起 了 个 别名 np 
arr = np.array (np.arange (4)) # 创建 一 个 序列 


print (arr) # 输出 [0 1 2 3] 

print (np.eye (2)) ”# 创建 一 个 维度 是 2 的 对 角 和 矩阵 ， 输 出 如 下 
lao 

| 


通过 调用 NumPy 库 提供 的 方法 ， 就 能 对 数组 序列 和 矩阵 进行 计算 。 本 节 的 重点 不 是 讲述 


NumpPy 库 中 有 哪些 方法 ， 而 是 以 这 个 库 为 例 ， 介 绍 如 何 通过 pip 命令 安装 并 导入 第 三 方 库 。 在 后 
续 章节 中 ， 还 会 用 到 其 他 第 三 方 库 ， 也 可 以 照 此 方法 导入 。 


3.5 ”通过 迭代 堪 加 深 理 解 多 态 性 


在 3.1.2 小 节 中 , 我 们 看 到 了 不 同 的 类 都 具有 相同 的 魔术 方法 ， 比 如 当 我 们 通过 print 打印 某 个 


类 时 ， 会 自动 触发 该 类 的 _repr 方法， 也 就 是 说 ， 针 对 不 同 的 类 ，_repr_ 方 法 会 表现 出 不 同 的 
形态 ， 体 现 出 “多 态 性 ”。 
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同样 ， 针 对 每 个 有 “被 遍历 ”需求 的 类 ， 也 可 以 让 _iter 和 next 方法 以 多 态 性 的 方式 实 
现 各 种 遍历 功能 。 比 如 在 下 面 程序 代码 的 第 2 行 中 ， 就 是 用 ip 来 遍历 myList 的 每 个 元 素 ， 原 因 是 
列表 对 象 中 有 能 满足 遍历 要 求 的 _iter 和 next 方法 。 
总 myList = [1,2,3,4] 
2 for i in myList: # 输出 1 到 4 
人 print (i) 

如 果 想 让 自 定义 的 类 具有 “可 遍历 ”的 特性 ， 即 能 以 in 的 方式 来 输出 每 个 元 素 ， 那 么 也 需要 
覆盖 〈 或 称 为 重 写 ) 这 两 个 方法 。 在 下 面 的 IterDemo.py 范例 程序 中 演示 了 “可 遍历 ”的 实现 方式 
〈 也 可 以 说 是 通过 友 代 的 实现 方式 ) ， 通 过 这 个 范例 程序 让 大 家 加 深 对 多 态 性 的 认识 。 


1 # !/usr/bin/env Python 

县 # coding=utf-8 

3 class createEven: # 有 “可 遍历 需求 ”的 类 
4 def _ init (self, min, max): 

= self.value = min 

6 self.min = min 

要 self.max = max 

8 def iter (self): # 输出 全 部 

9 print ("in iter") 

10 return self 

hb def next (self): # 生成 下 一 个 偶数 
和 print ("in next") 

3 self.value += 2 

14 return self.value 


15 myEvenList = createEven(0,6) 
16 for i in myEvenList: # 输出 myEventList 列表 中 不 大 于 10 的 偶数 


EL7 print (i) 
18 if (i>=10):; 
9 break 


在 第 8 行 的 _iter_ 方 法 中 返回 了 self， 在 第 11 行 的 _next_ 方 法 中 生成 了 下 一 个 偶数 。 在 15 
行 的 程序 语句 创建 一 个 包含 偶数 序列 的 myEvenList 对 象 后 ， 之 后 就 能 在 第 16 行 通过 in 来 遍历 其 
中 的 元 素 ， 这 段 代 码 的 输出 如 下 。 

in iter 

in next 

县 

in next 

4 

in next 

6 


从 执行 结果 可 知 , 一 旦 通过 in 来 遍历 , 即 会 触发 _iter 方法, 而 在 for 循环 里 遍历 myEvenList 
中 的 每 个 元 素 时 ， 都 会 触发 _next 方法 。 

通过 这 个 范例 程序 ， 我 们 看 到 了 “多 态 性 ”的 具体 实现 细节 ， 以 遍历 性 为 例 时 ， 可 以 在 相应 
类 中 实现 对 应 的 方法 〈 比 如 上 面 范 例 程序 中 的 _iter _ 和 next ) ， 于 是 在 遍历 不 同类 时 ， 就 会 
自动 触发 该 类 中 的 对 应 方法 , 从 而 让 这 两 个 方法 可 以 针对 不 同 的 类 表现 出 不 同 的 形态 ( 即 多 态 性 ) 。 
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3.6 ”本章 小 结 


在 本 章 前 面部 分 的 若干 个 范例 程序 中 ， 用 到 了 面向 对 象 的 程序 设计 思想 ， 从 中 可 以 综合 性 地 
了 解 “ 封 装 ”、“ 继 承 ” 和 “多 态 ” 这 三 大 特性 以 及 它们 对 开发 项 目的 帮助 。 

在 此 基础 上 ,在 3.5 节 和 3.6 节 给 出 了 若干 个 综合 使 用 面向 对 象 程序 设计 思想 实现 的 实用 范例 ， 
读者 可 以 从 中 加 深 对 面向 对 象 程序 设计 思想 理论 知识 的 理解 ,还 可 以 掌握 这 种 设计 思想 在 实际 项 目 
中 使 用 的 技巧 。 


在 语法 上 和 功能 上 没 问题 的 程序 也 未 必 能 成 功 运行 ， 这 是 因为 程序 运行 的 环境 会 存在 各 种 不 
确定 的 因素 。 比 如 当 使 用 remove 删除 列表 元 素 时 ， 如 果 元 素 不 存在 ， 系 统 就 会 抛 出 异常 。 又 如 ， 
当 程 序 读 写 文件 时 ， 如 果 文 件 不 存在 ， 系 统 也 会 抛 出 异常 。 

如 果 没 有 任何 异常 处 理 机 制 ， 出 现 异常 情况 时 程序 就 被 迫 中 止 运行 了 。 而 作为 开发 者 实际 所 
期 望 的 是 :第 一 能 看 到 异常 的 细节 从 而 知道 该 如 何 处 理 ;第 二 程序 能 继续 进行 而 不 是 因 异 常 而 中 止 。 
对 于 这 种 情况 ， 就 需要 用 到 Python 提供 的 异常 处 理 机 制 。 文 件 读 写 是 异常 处 理 机 制 的 一 个 比较 典 
型 的 使 用 场景 ， 所 以 本 章 将 综合 它们 来 讲述 这 两 方面 的 内 容 。 


4.1 异常 不 是 语法 错误 


在 简单 的 项 目 中 ， 会 触发 异常 处 理 流程 的 场景 并 不 多 ， 所 以 有 些 初级 程序 员 更 重视 语法 和 功 
能 方面 的 问题 ， 而 对 异常 处 理 流程 不 大 关注 ， 甚 至 在 代码 中 看 不 到 异常 处 理 相关 的 代码 。 

所 谓 异 常 《Exception) ， 也 被 称 为 例外 ， 它 不 是 语法 错误 ， 更 不 是 功能 缺陷 ， 而 是 项 目 在 运 
行 时 遇 到 意料 之 外 的 问题 ， 比 如 读 文件 时 目标 文件 并 不 存在 ， 或 是 操作 数据 库 时 无 法 连 到 数据 库 。 
正确 地 处 理 异常 情况 ,不 仅 能 保证 项 目 能 继续 正常 运行 ,更 能 明确 给 出 异常 的 细节 ， 从 而 能 有 效 地 
执行 异常 (或 故障 ) 处 理 和 恢复 等 操作 。 


4.1.1 通过 try...except 从 句 处 理 异 常 


在 Python 中 ， 监 控 并 处 理 异 常 的 基本 语法 格式 是 try.….except 从 句 ， 比 如 有 如 下 的 代码 。 


stockInfoList = ['600001"','600002'] 
2 stockInfoList.remove('600003') 
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print('following job') 


在 第 2 行 中 , 程序 语句 想 要 删除 stockInfoList 中 不 存在 的 一 个 元 素 , 运行 这 段 代码 时 , 程序 会 
立即 中 止 ， 在 控制 台中 会 出 现 如 图 4-1 所 示 的 错误 提示 信息 。 


\ 清 华 出 版 社 \PychnonWorkspace\charters\src\TryDemo.py", line 2, in <module> 


图 4-1 程序 异常 终止 的 输出 结果 


从 错误 提示 信息 中 可 知 ， 异 常 指向 第 2 行 ， 同时， 第 3 行 的 输出 语句 并 没有 执行 。 这 种 不 对 
异常 进行 处 理 的 做 法 是 非常 危险 的 ， 比 如 ATM 机 需要 不 间断 地 运行 ， 如 果 其 中 的 程序 遇 到 了 异常 
情况 ， 程 序 应 当 能 自动 处 理 从 而 保证 ATM 能 继续 运行 ， 如果 自 身 无 法 处 理 ， 也 应 该 立即 发 出 警告 
信息 ， 让 人 工 及 时 干预 。 出 于 这 个 原则 ， 我 们 在 TryDemo.py 范例 程序 中 改写 了 上 述 代码 ， 在 其 中 
增加 了 异常 处 理 的 语句 。 


Print('Could not Remove from List') 
print('following job') 


1 # !/usr/bin/env Python 

委 # coding=utf-8 

3 stockInfoList = ['600001','600002'] 
4 tr 

5 stockInfoList.remove('600003') 
6 except: 

7 

8 


在 改写 后 的 范例 程序 中 ， 用 第 4 行 的 try 语句 来 监控 第 5 行 的 remove 操作 ， 所 以 当 找 不 到 要 
删除 的 元 素 时， 就 跳 转 到 except 从 句 中 的 第 7 行程 序 语句 ， 之 后 第 8 行 的 代码 就 能 继续 运行 ， 因 
而 遇 到 这 种 异常 情况 时 就 不 会 再 意外 中 止 程序 。 

这 段 范例 程序 的 运行 结果 如 下 所 示 , 从 中 可 以 看 到 try...except 从 句 的 处 理 流程 ， 当 在 try 部 分 
出 现 异常 后 ， 抛 出 的 异常 会 被 except 从 句 捕获 并 进行 处 理 ， 处 理 之 后 就 能 继续 执行 except 之 后 的 
程序 语句 。 

Could not Remove from List 

following job 


4.1.2 通过 不 同 的 异常 处 理 类 处 理 不 同 的 异常 


在 范例 程序 TryDemo.py 的 第 6 行 中 ，except 后 面 没有 通过 参数 来 指定 处 理 异常 的 类 ， 这 时 
Python 系统 将 默认 地 用 Except 类 来 处 理 所 有 种 类 的 异常 。 事 实 上 ，Python 还 提供 了 诸多 专业 处 
理 各 类 异常 的 类 ， 可 以 在 except 从 句 中 通过 参数 来 指定 这 段 except 从 句 能 捕获 和 处 理 哪 一 类 异 
常 。 

在 下 面 的 ExceptionUsageDemo.py 范例 程序 中 ， 将 看 到 各 种 常用 异常 处 理 类 的 应 用 场景 。 
# !/usr/bin/env Python 

# coding=utf-8 

stockInfoList = ['600001','600002'] 

try: 


心 w N 
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5 print (stockInfoList[4]) # 索引 出 错时 会 触发 
6 # 1/0 

六 except IndexError: 

8 Print('Index Error') 

9 trys 

10 # 参数 类 型 正确 ， 但 返回 值 不 符合 预期 时 会 触发 
二 Print(stockInfoList.index('6000037)) 
12 except ValueError: 

13 print('Value Error') 

4 ry 

5 2+'error' # 函数 参数 类 型 不 正确 时 会 触发 
16 except TypeError: 

17 print('Type Error') 

DE 

19 1/0 # 除 零 异常 

20 except ZeroDivisionError: 

了 2 print('ZeroDivision Error') 

22 class Car: 

a def _init__ (self,owner): 

24 self.owner = owner 

25 myCar = Car("Peter") 

26° Cry 

和 2 汪 print (myCar.price) # 引用 属性 错误 时 触发 
28 except AttributeError: 

29 print('Attribute Error') 


在 第 7 行 的 except 从 句 中 引入 了 IndexError 异常 处 理 类 ， 用 它 来 处 理 诸如 索引 出 错 的 异常 。 
由 于 在 第 5 行 的 代码 中 ， 我 们 故意 用 错误 的 索引 值 来 读 取 stockInfoList 中 的 对 象 ， 因 此 会 触发 
IndexError 异常 。 

请 注意 ， 专 业 的 异常 处 理 类 只 能 处 理 “ 本 职 ”范围 内 的 异常 ， 如 果 注 释 掉 第 5 行 的 代码 ， 同 
时 取消 第 6 行 的 注释 ， 以 便 让 除 零 语句 生效 ， 就 会 发 现 IndexError 无 法 处 理 除 零 异 常 。 

第 12 行 的 ValueError 异常 类 能 处 理 “ 参 数 类 型 正确 ， 但 返回 值 不 符 预期 ”的 异常 情况 ， 比 如 
在 第 11 行 中 ，index 方法 的 参数 正确 ， 但 输入 该 参数 后 ， 返 回 的 是 “索引 值 找 不 到 ”的 结果 ， 所 以 
会 触发 ValueError 异常 。 

第 16 行 的 TypeError 异常 处 理 类 会 在 “函数 参数 类 型 不 正确 ”时 被 触发 ， 比 如 在 第 15 行 执行 
“加 法 ”运算 时 ， 预 期 的 参数 应 该 都 是 数值 类 型 ， 但 这 里 出 现 了 字符 串 类 型 ， 不 符合 “加 法 ”运算 
要 求 的 参数 类 型 ， 所 以 会 抛 出 此 类 异常 。 

第 19 行 的 ZeroDivisionError 会 捕获 并 处 理 除 零 异 常 ,这 个 比较 好 理解 。 第 28 行 的 AttributeError 
异常 会 在 “引用 对 象 属性 错误 ”时 被 触发 ， 比 如 在 第 27 行 中 引用 了 Car 类 中 不 存在 的 price 属性 ， 
所 以 触发 了 该 类 异常 。 

除了 上 面 提 到 的 各 种 异常 处 理 类 之 外 ， 在 表 4-1 中 ， 归 纳 了 Python 语言 中 其 他 常用 的 异常 处 
理 类 。 


he 
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表 4-1 Python 语言 中 其 他 常用 的 异常 处 理 类 一 览 表 


异常 处 理 类 名 触发 场景 

ee 无 法 完成 操作 系统 级 的 任务 时 ， 会 触发 该 类 异常 ， 比 如 无 法 打开 
文件 时 ， 会 触发 此 类 异常 

FloatingPointError 浮 点 类 计算 错误 

OverflowError 数值 运算 时 超过 此 种 类 型 数值 的 最 大 范围 

UnicodeTranslateError Unicode 转换 时 出 错 


4.1.3 在 except 中 处 理 多 个 异常 


在 之 前 的 范例 程序 中 ， 其 中 的 except 语句 里 只 传 入 了 一 个 参数 ， 因 而 except 程序 语句 块 只 能 
捕获 并 处 理 一 类 异常 。 

在 实际 的 应 用 场景 中 , 无 法 保证 在 try 程序 语句 块 中 只 发 生 一 类 异常 ， 所 以 可 以 在 except 后 通 
过 参数 来 传 入 多 个 异常 处 理 类 ， 用 以 处 理 可 能 发 生 的 多 类 异常 。 在 下 面 的 范例 程序 
HandleMoreExceptDemo.py 中 演示 这 种 处 理 多 类 异常 的 情况 。 
1 # !/usr/bin/env python 
2 # coding=utf-8 
3 def divide(x,y): 
4 try: 
5 return x/y 
6 except (ZeroDivisionError, TypeError, Exception) as e: 
7 Print(e) 
8 。 # 如 下 是 各 种 错误 的 调用 
9 printl(divide(1,'1')) # 触发 TypeError 异常 
10 print(divide(1,0)) # 触发 ZeroDivisionError 

在 第 3 行 的 divide 方法 中 ， 是 想 对 两 个 数字 类 型 的 参数 进行 除法 运算 并 返回 ， 但 在 实际 应 用 
中 ,由 于 无 法 预料 输入 参数 的 类 型 以 及 具体 数字 ,因此 在 第 4 行 到 第 7 行 的 方法 程序 区 块 中 ,是 通 
过 try...except 从 名 捕获 并 处 理 可 能 发 生 的 各 类 异常 情况 。 

在 实际 调用 时 ， 在 第 9 行 中 触发 了 TypeError 异常 ， 在 第 10 行 中 触发 了 ZeroDivisionError 异 
常 。 因 为 在 第 6 行 的 except 从 句 中 的 括号 里 传 入 了 多 个 异常 处 理 类 ， 所 以 这 两 类 异常 都 能 被 第 6 
行 的 except 程序 语句 块 捕获 并 处 理 。 

需要 说 明 的 是 ， 毕 竞 我 们 无 法 预料 之 前 try 从 句 中 发 生 异 常 的 种 类 ， 所 以 如 果 在 except 从 句 中 
传 入 了 多 个 异常 处 理 类 ， 那 么 最 好 再 用 Except 这 个 能 处 理 所 有 异常 的 类 来 兜 底 ， 以 免 出 现 “ 异 常 
情况 不 在 处 理 范围 内 ”从 而 导致 程序 因 无 法 处 理 异常 而 中 止 的 情况 。 


4.1.4 通过 raise 语句 直接 抛 出 异常 


在 前 面 的 TryDemo.py 范例 程序 中 ， 当 异常 发 生 时 ， 是 自动 触发 并 进入 到 except 的 异常 处 理 流 
程 。 此 外 ， 也 可 以 通过 raise 语句 以 显 式 的 方式 触发 异常 ， 下 面 的 RaiseDemo.py 范例 程序 将 演示 这 
种 用 法 。 
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1 # !/usr/bin/env python 

2 # coding=utf-8 

3 def divide(x,y): 

4 if y==0: 

5» raise Exception('Divisor is 0') 

6 Ey 

了 return x/y 

8 except (TypeError): 

9 raise Exception('Parameters Type Error') 
10 ‘trys: 

了 print (divide(1,0)) 

12 except (Exception) as e: 

13 print (e) # 输出 Divisor is 0 

和 7 

15 print (divide(1,'1')) 

16 except (Exception) as e: 

a print (e) # 输出 Parameters Type Error 


在 第 3 行 定义 的 divide 方 法 中 实现 了 x 除 以 y 的 功能 ,在 其 中 第 4 行 的 证 条 件 语 句 中 , 当 divide 
方法 中 除数 y 是 0 时 , 则 在 第 5 行使 用 raise 语句 抛 出 一 个 异常 , 而 且 通 过 Exception 类 的 参数 指定 
了 该 异常 的 提示 信息 。 

在 第 11 行 调用 divide 方法 时 ， 通 过 传 入 参数 的 方式 触发 了 除数 为 0 的 异常 ， 由 此 进入 第 12 
行 的 except 处 理 异常 的 流程 。 执 行 第 13 行 的 打印 语句 之 后 ， 就 能 看 到 “Divisor is 0” 的 输出 信息 ， 
由 此 明确 了 异常 发 生 的 原因 。 

可 以 对 比 一 下 第 5 行 的 raise 语句 和 第 7 行 被 try 监控 的 语句 ， 在 第 5 行 的 程序 语句 是 主动 抛 
出 异常 ， 而 在 第 7 行 则 是 一 旦 出 现 “ 类 型 错误 ”等 异常 情况 ， 此 类 异常 就 会 自动 被 第 8 行 的 except 
从 句 处 理 。 

此 外 ， 还 可 以 像 第 5 行 和 第 9 行 的 代码 那样 ， 通 过 raise 语句 抛 出 异常 以 此 来 重新 组 织 描述 异 
常 的 信息 。 这 样 的 话 ， 与 系统 给 出 的 异常 信息 相 比 ， 我 们 自 定义 的 异常 描述 信息 会 更 具有 操作 性 ， 
这 也 是 平时 开发 项 目 中 实践 的 要 点 。 


4.1.5 引入 finally 从 名 


在 try...except 从 句 后 面 还 可 以 引入 finally 从 句 。finally 的 特性 是 : 不 管 发 生 异 常 与 否 ， 或 者 
不 管 发 生 何 种 异常 ，finally 程序 语句 块 都 会 被 执行 到 。 在 下 面 的 FinallyDemo.py 范例 程序 中 演示 了 
finally 从 句 的 常规 用 法 。 


# !/usr/bin/env Python 
# coding=utf-8 
stockInfoList = ['600001"','600002'] 
try: 
stockIinfoList.remove('600003') 
#stockInfoList.remove('600001') 
except: 
Print('Could not Remove from List') 
finally: 


ownamum 必 wb 
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10 print('in finally') 
11 print('following job') 

上 面 这 个 范例 程序 是 根据 TryDemo.py 范例 程序 改编 而 来 , 由 于 第 5 行 的 remove 会 触发 异常 ， 
因此 会 执行 第 8 行 的 语句 ， 之 后 也 会 执行 第 10 行 finally 从 句 中 的 语句 。 这 个 范例 程序 的 输出 结果 
如 下 : 

Could not Remove from List 


in finally 
following job 


如 果 去 除 第 6 行 的 注释 同时 注释 掉 第 5 行 的 程序 代码 ， 此 时 不 会 触发 异常 ， 不 过 依然 会 执行 
第 10 行 finally 从 句 中 的 语句 ， 执 行 结果 如 下 : 


in finally 
following job 


在 具体 的 使 用 中 ，finally 从 句 能 直接 和 try 从句 匹配 而 无 需 带 except。 这 时 哪怕 try 中 有 return 
语句 , 依然 会 执行 finally 从 名 中 的 程序 语句 , 下 面 再 来 看 一 下 FinallyWithReturnDemo.py 范例 程序 。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

总 def funcWithFinally() : 

4 try: 

5 Printt"Tn Fry 

6 return "Return in Try" 

a finally: 

8 print ("In Finally") 

9 return "Return in Finally" 
10 print(funcWithFinally()) 


在 第 6 行 中 ， 虽 然 在 try 语句 中 使 用 retum 语句 来 返回 , 但 依然 会 执行 第 7 行 finally 从 句 中 的 
程序 语句 , 运行 结果 如 下 , 从 运行 结果 可 知 , 第 9 行 的 return 语句 跳 过 了 第 6 行 return 语句 的 运行 ， 
即 提前 返回 了 。 

Tn Tr 


In Finally 
Return in Finally 


如 果 注 释 掉 第 9 行 的 return 语句 ， 那 么 就 能 看 到 如 下 的 运行 效果 ， 这 说 明 执行 完 finally 从 句 
依然 会 执行 try 中 的 return 语句 。 
In Try 


In Finally 
Return in Try 


也 
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4.2 项目 中 异常 处 理 的 经 验 谈 


从 前 文 的 介绍 中 可 知 ， 异 常 处 理 的 语法 其 实 并 不 复杂 。 不 过 在 实际 项 目 中 ， 应 确保 系统 在 异 
常情 况 下 也 能 正常 继续 运行 。 在 本 节 中 , 读者 能 看 到 实际 项 目 中 异常 处 理 的 若干 准则 以 及 常见 的 实 
施 方式 。 


4.2.1 用 专业 的 异常 处 理 类 来 处 理 专门 的 异常 


之 前 讲述 的 实现 方式 是 通过 在 except 中 设置 参数 来 引入 多 个 异常 处 理 类 ， 如 下 所 示 。 
except (ZeroDivisionError, TypeError, Exception) as e: 
a 处 理 异常 的 程序 语句 

在 一 般 的 应 用 场景 中 ， 如 果 可 以 用 同一 段 代码 处 理 多 种 不 同类 型 的 异常 ， 上 面 这 种 编写 方式 
是 可 以 的 ， 但 在 有 些 应 用 场景 中 发 生 不 同类 型 异常 时 ， 则 需要 采用 不 用 的 处 理 措施 。 

比如 连接 数据 库 异 常 时 需要 重 连 ， 读 文件 时 发 现 文件 不 存在 ， 都 需要 提示 错误 信息 ， 这 时 就 
不 能 用 同一 个 except 来 处 理 不 同 的 异常 ， 而 应 该 用 不 同 的 except 来 分 别处 理 ， 相 关 代码 如 下 所 示 。 
水 except (DatabaseError) as dbError: 
2 重新 连接 数据 库 
| except (FileNotFoundError) as fileError: 
4 提示 文件 找 不 到 的 信息 
5 except (Exception) as e: 
6 提示 错误 信息 

在 这 种 应 用 场景 中 ， 虽 然 在 第 1 行 到 第 4 行 ， 用 专门 的 异常 类 针对 性 地 处 理 了 数据 库 和 文件 
的 异常 ， 但 在 之 前 的 try 语句 中 ， 还 是 可 能 出 现 其 他 种 类 的 异常 。 也 就 是 说 ， 用 各 种 专门 的 异常 处 
理 类 未 必 能 涵盖 所 有 可 能 发 生 的 异常 类 型 ， 所 以 ， 还 得 像 第 5 行 和 第 6 行 那样 ， 用 Exception 类 来 
兜 底 处 理 那些 用 专门 的 异常 类 无 法 涵盖 到 的 异常 。 


4.2.2 ”尽量 缩小 异常 监控 的 范围 


在 处 理 实际 业务 的 时 候 ， 比 如 某 个 方法 有 50 行 ， 其 中 第 4 行 到 第 10 行 的 程序 语句 用 来 连接 
数据 库 ， 第 30 行 到 40 行 的 程序 语句 用 来 读 文件 。 一 种 比较 省 事 的 方法 是 ， 直 接 用 一 个 try 来 包围 
第 4 行 到 第 40 行 的 程序 语句 ， 把 一 些 不 需要 监控 的 程序 语句 也 用 try 包围 起 来 了 。 

4 “trys 
8 。 连接 数据 库 的 程序 语句 


11 行 到 23 行 ,不必 监控 的 程序 语句 块 
30 
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5 读 文件 的 程序 语句 


41 except (Exception) as e: 
42 处 理 异常 信息 
这 样 做 的 后 果 是 ， 一 旦 第 8 行 出 现 数据 库 异常 ， 那 么 会 直接 跳 转 到 第 41 行 的 异常 处 理 代码 ， 
这 样 原本 不 该 受到 影响 的 程序 语句 〈 比 如 第 30 行 到 第 40 行 读 文件 的 程序 语句 ) 也 不 会 被 执行 了 。 
由 此 可 知 ， 应 该 在 程序 中 用 多 个 try…catch 来 包围 应 该 被 监控 到 的 程序 语句 ， 对 于 无 需 监 控 的 
程序 语句 ， 确 保 不 该 受到 try 影响 。 修 改 好 的 程序 语句 样式 如 下 所 示 : 
es 


8 ”连接 数据 库 的 程序 语句 


10 except (Exception) as e: 


处 理 数据 库 异 常 的 程序 语句 
11 行 到 23 行 ， 不 必 监 控 的 程序 语句 块 无 须 包 含 在 try...catch 中 
300 Eos 
ee 读 文 件 的 程序 语句 


40 except (Exception) as e: 


41 处 理 文件 异常 的 程序 语句 


4.2.3 ”尽量 缩小 异常 的 影响 范围 


除了 刚才 提 到 的 尽 可 能 缩小 try 语句 的 监控 范围 之 外 ， 当 发 生 异 常情 况 时 ， 还 应 当 把 异常 造成 
的 影响 控制 到 最 小 的 程度 。 下 面 来 看 一 个 范例 程序 TryComplexDemo.py。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 stockPirceList = [100,200,'600001',300,400] 

4 # try: 

5 # for item in stockPirceList: 

6 # Print ("Current Price: ",item + 100) 

3 #except: 

8 # print('Error when Printing current price.') 
9 for item in stockPirceList: 

10 ys 

11 print ("Current Price: ",item + 100) 

了 2 except: 

3 Print('Error when printing current price.') 


在 这 段 范例 程序 中 ,目的 是 想 遍 历 stockPriceList 这 个 列表 , 获取 其 中 的 元 素 后 加 100 再 输出 。 
如 果 去 除 第 4 行 到 第 8 行 的 注释 ， 同 时 注释 掉 第 9 行 到 第 13 行 的 程序 语句 ， 就 会 发 现 当 遍历 到 
'600001' 这 个 字符 串 类 型 的 元 素 时 ， 程 序 即 会 中 止 ， 而 不 会 再 处 理 后 续 的 300 和 400 这 两 个 元 素 ， 
输出 结果 如 下 所 示 : 


Current Price: 200 
Current Price: 300 
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Error when printing current price. 


在 这 个 应 用 场景 中 我 们 期 望 的 是 ， 处 理 完 列表 中 所 有 正确 的 元 素 。 也 就 是 说 ， 遇 到 列表 中 有 
不 规范 数据 的 情况 ， 可 以 跳 过 不 处 理 ， 也 可 以 提示 信息 ， 但 不 能 中 止 对 列表 后 续 元 素 的 处 理 。 

对 此 ， 请 看 第 10 行 到 第 13 行 的 程序 语句 ， 范 例 中 是 把 try 语句 写 在 for 循环 内 ， 这 样 哪怕 是 
遍历 单个 元 素 时 出 现 异常 ， 也 会 继续 遍历 列表 中 的 后 续 元 素 ， 而 不 会 意外 中 止 。 改 写 后 程序 的 执行 
结果 如 下 : 

Current Price: 200 

Current Price: 300 

Error when printing current price. 


Current Price: 400 
Current Price: 500 


在 处 理 异常 时 ， 还 需要 注意 这 样 的 场景 比如 有 两 个 并 行 处 理 的 业务 ， 即 使 其 中 一 个 业务 出 
现 异常 ， 针 对 这 个 业务 抛 出 异常 了 ， 不 过 另 一 个 业务 应 该 不 受 影响 继续 执行 。 
现在 看 一 下 下 面 的 代码 ， 由 于 用 同一 个 try 语句 包含 了 两 个 并 行 的 业务 ， 因 此 在 执行 到 第 2 行 


读 取 文件 业务 方法 而 抛 出 异常 时 ， 第 3 行 读 取 数 据 库 的 方法 也 会 被 连带 中 止 〈 执 行 不 到 ) 。 
0 tr 

腕 tool.calDataInFile("c:\\1.txt") # Reading File 

< Tool .calDataInDB (“localhost:3309/myDB”) # Reading DB 

4 except: 

5 异常 处 理 的 程序 语句 


对 此 ， 需 要 用 2 个 try 语句 分 别处 理 这 两 个 不 同 的 业务 ， 示 例 代码 如 下 : 


全 try: 

2 tool.calDataInFile("c:\\1.txt") # Reading File 
3 except: 

4 处 理 文件 类 的 异常 

5 trys 

6 tool .calDataInDB ("localhost:3309/myDB") # Reading DB 

7 except: 

8 


处 理 数据 库 类 的 异常 


4.2.4 ”在 合适 的 场景 下 使 用 警告 


在 程序 的 调试 环境 和 生产 环境 中 可 以 引入 不 同 的 异常 级 别 ， 比 如 在 调试 环境 发 生 数 据 处 理 异 
常 时 ， 可 能 需要 打印 出 这 类 错误 信息 ， 以 便 确 认 程序 语句 是 否 已 经 对 此 做 了 充分 的 处 理 。 但 在 生产 
环境 中 ， 如 果 日 志 打印 过 多 ， 一 方面 会 影响 系统 的 性 能 ; 另 一 方面 也 不 利于 问题 的 定位 。 而 且 ,在 
生产 环境 的 程序 语句 一 般 是 经 过 在 调试 环境 上 反复 确认 过 的 , 出 现 问题 的 概率 很 小 , 所 以 无 需 再 输 
出 一 些 严重 程度 不 高 的 异常 提示 信息 

可 以 用 警告 (Waming) 级 别 的 输出 来 打印 “ 应 当 在 调试 环境 中 打印 但 不 该 在 生产 环境 中 打印 ” 
的 异常 情况 。 在 下 面 的 WarmingDemo.py 范例 程序 中 可 以 看 到 “警告 类 ”的 用 法 。 


# !/usr/bin/env python 
2 # coding=utf-8 
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总 import warnings 

4 # warnings.filterwarnings ("ignore") 
5 stockInfoList = ['600001','600002'] 
6 

7 

8 


try: 
stockInfoList.remove('600003') 
except: 
9 warnings.warn('Could not Remove from List') 
10 finally: 
hi print('in finally') 


12 print('following job') 

在 第 3 行 中 通过 import 导入 了 warnings 这 个 异常 类 , 请 注意 , 由 于 第 7 行 的 remove 方法 会 触 
发 异常 〈 找 不 到 要 删除 的 元 素 ) ， 因 此 会 执行 第 9 行 的 程序 语句 ， 这 个 范例 程序 的 运行 结果 如 下 
其 中 第 3 行 和 第 4 行 输出 的 是 wamings.warn 的 结果 。 

in finally 

following job 

D:\software\java web\ 清 华 出 版 社 \PythonWorkSpace\charter4\src\WarningDemo.py:9: 

UserWarning: Could not Remove from List 

warnings.warn('Could not Remove from List') 

在 调试 环境 中 有 必要 这 样 做 ， 因 为 需要 发 现 每 个 可 能 触发 异常 的 地 方 ， 并 确保 这 些 异 常 不 会 
影响 业务 。 经 过 确认 ，remove 导致 的 异常 不 会 影响 主流 程 ， 所 以 在 上 线 到 生产 环境 运行 之 前 ， 可 
以 去 掉 第 4 行 的 注释 ， 指 定 代 码 无 需 输 出 wamings 级 别 的 异常 。 取 消 注释 后 ， 运 行 结果 如 下 所 示 
再 也 看 不 到 警告 级 别 的 异常 信息 了 。 

in finally 

following job 


4.3 ”通过 IO 读 写 文件 


文件 读 写 是 项 目 中 不 可 或 缺 的 功能 ，Python 本 身 的 标准 库 中 就 提供 了 文件 读 写 的 方法 ， 调 用 
这 些 方法 可 以 方便 地 操作 文件 。 


4.3.1 以 各 种 模式 打开 文件 


在 本 节 中 ， 先 通过 一 个 读 txt 文件 的 范例 程序 来 演示 一 下 Python 读 文件 的 一 般 方式 。 
首先 ， 在 ci\1 目录 中 新 建 一 个 名 为 python.txt 的 文件 ， 在 其 中 写 入 如 下 三 行文 字 。 


Hello Python! 
This is second line. 
This is third line. 


随后 ， 编 写 范例 程序 ReadFileDemo.py， 在 其 中 实现 读 文 件 的 功能 。 
1 # !/usr/bin/env python 
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# coding=utf-8 
f = open("c:\\1\\python.txt",'r') 
line = f.readline() 
while line: 
print (line, end="'') 
line = f.readline() 
f.close() 


在 第 3 行 中 通过 open 方法 打开 指定 的 文件 ， 请 注意 ， 如 果 出 现 描 述 路 径 的 单 斜 杠 ， 则 需要 用 
双 斜 杠 “\\” 来 转 义 ， 而 open 方法 的 第 二 个 参数 表示 打开 文件 的 模式 ， 这 里 “r” 表 示 以 “ 读 取 ” 
模式 打开 ， 这 也 是 默认 的 文件 打开 模式 。 

文件 打开 后 ， 由 于 文件 里 有 多 行文 字 , 则 需要 通过 第 4 行 的 readline 语句 以 及 第 5 行 到 第 7 行 
的 循环 方式 逐 行 打印 从 文件 中 读 取 的 内 容 ， 打 印 完成 后 ， 则 需要 通过 第 8 行 的 close 方法 关闭 文件 
对 象 。 

由 于 文件 对 象 会 占用 系统 资源 ， 而 且 操作 系统 同时 能 打开 的 文件 数量 也 是 有 限 的 ， 因 此 在 用 
完 文件 后 ， 别 忘记 调用 close 方法 关闭 文件 。 这 个 范例 程序 的 运行 结果 如 下 ， 从 运行 结果 可 知 ， 该 
程序 实现 了 逐 行 输出 的 功能 。 

Hello Python! 

This is second line. 

This is third line. 

除了 刚才 提 到 的 用 “r” 参数 以 “ 读 取 ” 的 模式 打开 文件 外 ，Python 中 的 open 方法 还 支持 用 表 
4-2 列 出 的 其 他 常见 模式 来 打开 文件 。 


表 4-2 打开 文件 时 常用 的 各 种 模式 一 览 表 


oo auwewN 


参数 值 | 含义 

多 读 取 模式 

Ww 写 入 模式 

rt 读 写 模式 ， 从 文件 头 开始 写 ， 保 留 原文 件 中 没有 被 覆盖 的 内 容 


w+ 读 写 模式 ， 写 的 时 候 如 果 文 件 存在 ， 原 文件 会 被 清空 ， 从 头 开始 写 
附加 写 模式 (不 可 读 ), 若 文 件 不 存在 , 则 会 创建 该 文件 , 如 果 文件 存在 ， 
写 入 的 数据 会 被 加 到 文件 末尾 ， 即 文件 原来 的 内 容 会 被 保留 
附加 读 写 模式 。 若 文件 不 存在 ， 则 会 创建 该 文件 ， 如 果 文 件 存 在 ， 写 入 
的 数据 会 被 加 到 文件 末尾 ， 即 文件 原来 的 内 容 会 被 保留 

b 三 进 制 模式 ， 而 非 文 本 模式 


4.3.2 引入 异常 处 理 流程 


在 前 文 介绍 的 读 文 件 范例 程序 中 ， 当 要 读 取 的 文件 不 存在 时 ， 应 当 提 示 对 应 的 信息 ， 而 不 该 
中 止 程序 。 而 且 ， 在 读 完 文件 后 ， 应 当 确保 在 发 生 和 没 发 生 异 常 的 各 种 场景 下 都 要 调用 close 方法 
关闭 文件 对 象 。 所 以 一 般 会 在 操作 文件 (不 仅 读 ， 而 且 写 ) 的 程序 代码 中 引入 ty.…except...finally 
从 句 来 处 理 文件 读 写 操作 触发 的 异常 。 

在 下 面 的 ReadFileWithTry.py 范例 程序 中 将 通过 引入 异常 处 理 流程 来 确保 读 写 文件 程序 代码 
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的 健壮 性 。 

和 # !/usr/bin/env Python 

# coding=utf-8 

3 try: 

4 #filename = 'c:\\1\\python]1.txt' 

5 filename = 'c:\\1\\python.txt' 

6 f = openl(filename,'r') 

了 | line = 和 .readline() 

8 while line: 

9 print (line, end="'') 

10 line = f.readline() 

11 except: 

12 Print ("Error when handling the file:" + filename) 
13. ELnallye 

14 ys 

5 f.close() 

16 except: 

En Print ("No Need to close file:" + filename) 


与 之 前 范例 程序 不 同 的 是 ， 第 4 行 到 第 10 行 读 文件 的 程序 代码 被 包含 到 了 第 3 行 所 示 的 try 
语句 内 部 ， 这 样 一 旦 发 生 读 文件 异常 时 ， 比 如 去 掉 第 4 行 的 注释 ， 读 到 了 一 个 不 存在 的 文件 ， 则 会 
执行 第 12 行 的 语句 ， 程 序 不 会 因 异 常 而 中 止 。 

由 于 无 论 是 发 生 异 常 还 是 没 发 生 异 常 ， 都 需要 关闭 文件 对 象 , 因此 要 把 close 语句 写 到 在 第 13 
行 到 第 17 行 的 finally 从 句 中 。 

如 果 读 取 文 件 时 没 发 生 异 常 ， 那 么 finally 从 句 中 的 第 15 行 close 语句 能 正常 执行 ， 如 果 打 开 
了 一 个 不 存在 的 文件 ， 比 如 第 4 行 的 cxNl\Npythonl.txt'， 那 么 人 对象 其 实 是 不 存在 的 ， 所 以 第 15 行 
调用 close 关闭 文件 对 象 f 时 会 抛 出 异常 ,但 是 由 于 文件 没有 打开 , 因而 无 需 关 闭 , 这 就 是 要 把 close 
语句 包含 在 try...except 从 句 中 的 原因 。 


4.3.3” 写 文件 


可 以 通过 调用 write 方法 来 写 文件 ， 在 下 面 的 WriteFileDemo.py 范例 程序 中 演示 了 Python 写 
文件 的 程序 编写 逻辑 ， 写 文件 的 程序 逻辑 同样 是 用 try 包含 起 来 。 


1 # !/usr/bin/env Python 

# coding=utf-8 

3 ey 

4 filename = 'c:\\1\\myFile.txt' 
S f = openl(filename,'w') 

6 f.write('Hello,') 

和 f.write('Python!') 

8 except: 

9 print ("Error when writing the file:" + filename) 
10 finally: 

11 Es 


了 f.close() 
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3 except: 
14 print ("No Need to close file:" + filename) 

在 第 5 行 中 调用 open 方法 ， 以 w 〈 写 ) 模式 打开 了 c:Nl\myFile.txt 这 个 文件 ， 随 后 在 第 6 行 
和 第 7 行 用 两 个 write 语句 向 这 个 文件 中 写 了 两 段 话 。 

这 段 范例 程序 有 两 点 需要 注意 : 第 一 ， 当 用 'w' 模式 打开 文件 并 写 文件 时 ， 如 果 文 件 不 存在 ， 
就 会 创建 一 个 ,如果 存在 ， 则 会 清空 原文 件 再 写 入 新 的 东西 。 如 果 不 想 清空 原文 件 而 是 直接 追加 新 
的 内 容 ， 就 需要 使 用 'a' 模式 打开 文件 ;第 二 ， 写 文件 时 ， 系 统一 般 不 会 立刻 写 ， 而 会 先 放 到 缓存 
中 ， 只 有 当 调 用 close() 方 法 时 ， 系 统 才 会 把 缓存 中 的 内 容 全 部 写 入 文件 中 。 


> 全 i 
4.4 ” 读 写 文件 的 范例 

在 前 面 的 各 节 中 ， 讲 述 了 读 写 文件 的 常用 方法 ， 从 本 节 开 始 将 通过 一 些 实际 的 范例 ， 让 大 家 
进一步 理解 在 Python 中 读 写 文件 的 实际 技能 。 


4.4.1 复制 与 移动 文件 


复制 和 移动 文件 的 差别 是 ， 复 制 后 源 文件 依然 存在 而 移动 后 源 文件 会 被 删除 。 在 下 面 的 
CopyAndMoveFile.py 范例 程序 中 , 通过 调用 Python 的 os 和 shutil 这 两 个 自 带 的 库 来 实现 文件 的 复 
制 和 移动 功能 。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 import os,shutil # 通过 import 导入 两 个 库 

4 def moveFilel(src,dest): 

和 if not os.path.isfile(src) : 

6 Print("File not exist!" + src) 

| else: 

8 fpath=o0s.path. split (dest) [0] # 获取 路 径 
9 if not os .path.exists (fpath) : 

10 os .makedirs (fpath) # 如 果 路 径 不 存在 ， 则 创建 
iT shutil.move (src, dest) # 移动 文件 
12 print('Finished Moving') 

13 def copyFilel(src,dest): 

14 if not os.path.isfile(src) : 

15 print ("File not exist!" + src) 

16 else: 

317 fpath=os.path.split(dest) [0] # 获取 路 径 
18 if not os .path.exists (fpath) : 

19 os .makedirs (fpath) # 创建 路 径 
20 shutil.copyfile(srcvdest) # 复制 文件 
2 下 print('Finished Copying') 

22 ”# 调用 方法 


23 srcForCopy='c:\\1\\python.txt' 
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24 destForCopy='c:\\1\\python]1.txt" 
25 copyFile (srcForCopy,destForCopy) 
26 srcForMove='c:\\1\\python.txt" 

27 destForMove='c:\\1\\python2.txt" 
28 moveFile (srcForMove,destForMove) 


在 第 4 行 的 moveFile 方法 中 实现 了 移动 文件 的 功能 ， 它 的 两 个 参数 分 别 表示 要 移动 的 源 文件 
和 目标 文件 。 在 第 5 行 中 通过 调用 os.path.isfile 方法 来 判断 源 文件 是 否 存 在 ， 不 存在 则 提示 出 错 的 
信息 。 

在 第 8 行 中 通过 os.path.split(dest)[0] 来 获取 目标 文件 的 路 径 ，split 方 法 会 返回 一 个 数组 ， 其 中 
第 一 个 元 素 表 示 路 径 ， 第 二 个 元 素 表示 文件 名 。 如 果 路 径 不 存在 ， 则 执行 第 10 行 ， 调 用 os 库 的 
makedirs 方法 创建 路 径 ， 一 切 准备 就 绪 后 ， 再 执行 第 11 行 的 shutil.move 方法 移动 文件 。 

第 13 行 的 copyFile 和 moveFile 很 相似 ， 在 第 20 行 调用 了 shutil.copyfile 实现 了 文件 的 复制 。 

第 23 行 到 第 28 行 的 程序 语句 分 别 指定 了 移动 和 复制 文件 的 源 地 址 和 目标 地 址 , 而 第 25 行 和 
第 28 行 的 程序 语句 分 别 调用 了 复制 和 移动 方法 ， 调 用 完成 后 ， 在 c:\1 目录 中 即 可 发 现 有 了 
python1.txt 和 python2.txt 两 个 文件 ， 由 于 是 移动 ， 源 文件 python.txt 会 被 删除 。 


4.4.2 读 写 csv 文件 


在 程序 项 目 中 ， 一 般 会 用 csv 来 存储 表格 形式 的 文件 ， 而 且 csv 文件 还 能 被 Excel 以 表格 的 形 
式 打开 。csyv 文件 有 如 下 两 个 特点 : 第 一 ， 每 行 记 录 一 条 信息 ; 第 二 ， 每 条 记录 被 分 隔 符 《〈 一 般 是 
逗号 ) 分 隔 为 若干 个 字段 序列 ， 而 且 每 行 的 字段 序列 都 是 相同 的 。 

下 面 是 范例 程序 WriteCsv.py， 从 中 不 仅 能 看 到 通过 Python 中 csv 模块 写 csv 文件 的 方法 ， 还 
能 看 到 生成 csv 文件 后 该 文件 的 样式 。 


1 # !/usr/bin/env python 

2 # coding=utf-8 

3 import csv # 导入 csv 模 块 

4 head=['code','pPrice'v'Date'] 

5 stockl=["'600001',26,'20181212'] 

6 stock2=['600002',32,'20181212'] 

7 stock3=['600003',32,'20181212'] 

8 ”# 以 'a' 追 加 写 模式 打开 文件 

9 file = open('c:\\l\\stock.csv','a',newline='') 
10 ”# 设置 写 入 的 对 象 

11 write = csv.writer(file) 

12 # 写 入 具体 的 内 容 

13 write.writerow (head) 

14 write.writerow(stock1) 

15 write.writerow(stock2) 

16 write.writerow(stock3) 

17 print("Finished Writing CSV File.") 


从 第 4 行 到 第 7 行 的 程序 语句 分 别 定 义 了 csv 文件 的 表 头 和 三 组 数据 。 在 第 9 行 中 调用 open 
方法 以 'a 追加 写 的 模式 方式 打开 了 文件 c:\1\\stock.csv， 其 中 newline=" 是 说 明 每 写 完 一 行 数据 后 
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无 需 换行 。 二 B mn 
Ss Pe 全 1 cod i Dat 
在 第 11 行 中 设置 了 写 入 的 对 象 为 write, 随后 从 第 13 行 到 人 600 Price 吉 1 
第 16 行 的 程序 语句 ， 通 过 write 对 象 写 入 了 csv 的 文件 头 和 三 3 | 600002 32 20181212 
4 


行内 容 。 运 行 这 段 程序 代码 后 ， 在 cs 路径 下 就 可 以 看 到 ee 2 2 


stock.csv 文件 ， 该 文件 的 内 容 如 图 4-2 所 示 。 图 4-2 stockcsy 文件 示意 图 
在 下 面 的 ReadCsv.py 范例 程序 中 ， 就 能 读 取 到 刚才 创建 

的 stock.csv 文件 。 

1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 import csv,os 

4 fileName="c:\\1\\stock.csv"; 

5 if not os.path.isfile(fileName):  # 判断 文件 是 否 存在 

6 print ("File not exist!" + fileName) 

7 else: 

8 file = open (fileName,'r') # 以 读 的 模式 打开 文件 

9 reader = csv.reader (file) 

10 for row in reader: # 逐 行 读 取 csv 文件 

11 Ye 

Ti Print (row) 

13 except: 

14 Print ("Error when Reading Csv file.") 

5 file.close() # 读 完 后 关闭 文件 


在 第 5 行 中 通过 os.path.isfile 来 判断 要 读 取 的 文件 是 否 存在 ， 如 果 不 存 在 ， 则 执行 第 6 行 的 程 
序 语 句 输出 提示 信息 。 如 果 文 件 存在 ， 则 执行 第 8 行 的 语句 以 读 的 模式 打开 文件 ， 随 后 通过 第 10 
行 到 第 14 行 的 for 循环 逐 行 读 取 csv 文件 中 的 内 容 。 这 里 要 注意 try 的 写法 ， 如 果 读 取 到 文件 中 的 
某 行 出 错时 ， 仅 仅 是 中 止 读 取 当 前 行 的 内 容 ， 而 不 是 中 止 读 取 csv 文件 。 读 完 文件 后 ， 需 要 执行 如 
第 15 行 所 示 的 语句 ， 调 用 close 关闭 文件 。 


4.4.3 读 写 zip 压缩 文件 


在 程序 项 目 中 ， 经 常会 压缩 或 解压 缩 zip 文件 ， 在 下 面 的 CreateZip.py 范例 程序 中 演示 了 把 一 
个 目录 下 的 所 有 文件 (包含 该 目录 下 子 目 录 里 的 所 有 文件 ) 压缩 成 一 个 zip 文件 。 


全 # !/usr/bin/env Python 

2 # coding=utf-8 

3 import zipfile,os  # 导入 两 个 库 

4 zip=zipfile.ZipFile('c:\\1.zip'，'w') # 指定 压缩 后 的 文件 名 
5 try> 

6 for curPath, subFolders, files in os.walk('c:\\1'): 
for file in files: # 压缩 所 有 的 文件 
8 Print (os.path.join(curPath, file)) 

9 zip.write(os.path.join(curPath, file)) 

10 except: 

i Print ("Error When Creating Zip File") 


12 finally: 
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13 zip.close() 


在 第 6 行 的 外 层 for 循环 内 , 执行 os.walk 语句 , 遍历 并 压缩 了 c:\1 目录 下 的 所 有 文件 。os.walk 
方法 返回 一 个 包含 三 个 元 素 的 元 组 , 它们 分 别 是 每 次 遍历 的 路 径 名 、 该 路 径 下 的 子 目录 列表 以 及 当 
前 目录 (以 及 子 目录 ) 下 的 文件 列表 。 

在 第 7 行 的 内 层 循环 里 ， 依 次 遍历 由 执行 第 6 行 os.walk 所 得 到 的 所 有 文件 ， 之 后 是 执行 第 9 
行 的 write 语句 ， 把 文件 写 入 ci\1.zip 中 。 这 里 调用 了 os.path.join 方法 ， 用 来 组 装 路 径 和 文件 名 ， 
执行 第 8 行 的 print 语句 即 可 看 到 调用 join 方法 后 的 结果 (也 就 是 zip 文件 中 包含 的 所 有 文件 ) 。 

运行 该 范例 程序 后 ， 在 c 盘 根 目录 下 就 能 找到 zip 文件 ， 用 鼠标 单 击 这 个 zip 文件 后 ， 就 能 看 
到 该 压缩 文件 中 包含 了 cl 目录 下 的 所 有 文件 , 而 且 还 可 以 通过 第 8 行 的 打印 语句 看 到 被 压缩 的 文 
件 列表 。 

请 注意 这 个 范例 程序 中 try...except...finally 从 句 的 写法 ， 如 果 在 压缩 其 中 任何 一 个 文件 时 出 
错 , 则 是 中 止 整个 压缩 流程 , 这 和 常规 的 做 法 是 相符 的 , 在 第 13 行 的 finally 从 句 中 , 通过 调用 close 
方法 关闭 了 操作 zip 文件 的 对 象 。 
完成 文件 的 压缩 后 ， 通 过 下 面 的 UnZip.py 范例 程序 能 以 两 种 方法 来 解压 缩 zip 文件 。 

# !/usr/bin/env python 
# coding=utf-8 
import shutil,zipfile 
# shutil.unpack archive('c:\\1.zip', 'c:\\2') 
上 = zipfile.ZipFile("c:\\1.zip", 'r') 
for file in f.namelist(): 
f.extract (file,"c:\\2") 
f.close() 
第 一 种 解压 缩 的 方式 是 直接 调用 shutil.unpack_archive 方法 ， 该 方法 第 一 个 参数 表示 要 解压 缩 
的 zip 包 ， 第 二 个 参数 则 表示 解压 缩 后 释放 出 文件 要 存储 到 的 路 径 。 

在 第 5 行 到 第 8 行 中 给 出 了 第 二 种 解压 缩 方 式 ， 首 先是 在 第 5 行 调用 zipFile 方法 ， 打 开 要 解 
压缩 的 1.zip 压缩 包 ， 随 后 执行 第 6 行 的 for 循环 ， 依 次 遍历 压缩 文件 里 的 每 个 文件 ， 并 在 第 7 行 
调用 extract 方法 ， 把 文件 解压 缩 到 c:\2 目录 下 。 解 压缩 完成 后 ， 同 样 是 在 第 8 行 调用 close 方法 
关闭 操作 zip 文件 的 f 对 象 。 
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4.5 本 章 小 结 


本 章 讲述 的 异常 处 理 要 点 均 是 从 项 目 中 总 结 而 来 ， 异 常 处 理 的 原则 是 : “出 现 异 常 不 要 紧 ， 
但 要 把 异常 影响 的 范围 限制 到 最 小 ”。 具 体 的 实施 要 点 是 : 第 一 是 正确 地 提示 异常 信息 ; 第 二 是 合 
理 设置 监控 范围 和 异常 处 理 的 措施 ， 第 三 是 使 用 finally 从 句 回收 系统 资源 。 

为 了 让 读者 更 好 地 理解 处 理 异常 的 实施 方法 ， 本 章 还 讲述 了 与 文件 读 写 操作 有 关 的 内 容 ， 让 
读者 不 仅 能 从 实例 中 进一步 体会 异常 处 理 的 原则 ， 还 能 掌握 读 写 文件 的 方法 ， 可 谓 一 举 两 得 。 


第 品 


股市 的 常 用 知识 与 数据 准备 


以 前 面 章节 中 讲述 了 Python 的 基础 知识 为 起 点 ， 从 本 章 开始 ， 结 合股 票 交 易 数 据 分 析 与 处 理 
的 范例 ， 进 一 步 讲 述 Python 相关 的 知识 。 

在 本 章 中 ， 首 先 将 用 通俗 易 懂 的 语句 讲述 股票 交易 的 相关 知识 以 及 一 些 股市 的 常用 术语 
且 会 通过 描述 “竞价 制度 ”让 大 家 了 解 “股票 为 什么 会 涨 跌 ” 这 个 本 源 性 的 问题 。 

随后 ， 通 过 使 用 各 种 Python 库 ， 从 网 站 、 网 页 等 渠道 ， 下 载 股票 数据 并 保存 到 csv 等 格式 的 
文件 中 。 在 后 续 章 节 讲述 各 个 知识 点 时 ， 会 以 分 析 和 处 理 股票 交易 数据 的 范例 来 逐个 展开 。 另 外 
在 这 些 范例 中 将 会 使 用 本 章 给 出 的 方法 获取 股票 数据 。 


5.1 股票 的 基本 和 常识 


股票 也 叫 股份 证 书 ， 是 股份 有 限 公司 为 筹集 资金 而 发 行 的 持 股 凭证 ， 每 股 股 票 都 代表 着 股东 
对 该 股份 公司 拥有 一 个 基本 单位 的 所 有 权 。 股 票 可 以 转让 、 买 卖 或 作价 抵押 , 是 资金 市 场 的 主要 长 
期 信用 工具 。 


5.1.1 交易 时 间 与 T+1 交易 规则 


股票 的 交易 日 期 是 ， 除 法 定 休 假日 之 外 的 周一 至 周 五 ， 交 易 时 间 是 上 午 9:30 到 11:30， 下 午 
1:00 到 3:00。 

自 1995 年 1 月 1 日 起 ， 上 海 证 券 交 易 所 和 深圳 证 券 交 易 所 对 股票 交易 实行 “T+1” 的 交易 方 
式 . 即 指 投 资 者 当天 买 入 的 股票 在 当天 不 能 卖 出 ， 需 要 等 到 第 二 天 方 可 卖 出 。 
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5.1.2 证券 交易 市 场 


在 中 国内 地 有 两 个 证 券 交 易 的 场所 ,分别 是 上 海 证 券 交 易 所 和 深圳 证 券 交 易 所 ， 我 们 通常 所 
说 的 沪 深 股市 指 的 就 是 这 两 个 交易 市 场 。 

上 海 证 券 交易 所 简称 “上 交 所 ” (Shanghai Stock Exchange) ， 成 立 于 1990 年 11 月 26 日， 
而 深圳 证 券 交易 所 简称 “深交 所 ” (ShenZhen Stock Exchange) 成 立 于 1990 年 12 月 1 日。 


5.1.3 ”从 竞价 制度 分 析 股 票 为 什么 会 涨 跌 


竞价 制度 包括 集合 竞价 和 连续 竞价 制度 。 其 中 ， 集 合 竞价 是 指 在 每 个 交易 日 上 午 9 点 15 分 到 
9 点 25 分 投资 者 按 自己 心理 价位 申报 股票 买卖 价格 ， 交 易 所 对 全 部 有 效 的 委托 进行 一 次 集中 撮 
合 处 理 的 过 程 。 如果 在 集合 竞价 时 间 段 内 的 有 效 委 托 单 未 成 交 , 那么 这 些 委托 单 会 自动 进入 9 点 半 
开始 的 连续 竞价 阶段 的 交易 流程 。 

在 集合 竞价 过 程 中 ,投资 者 在 这 段 时 间 里 输入 的 价格 无 需 按时 间 优 先 和 价格 优先 的 原则 交易 
而 是 按 最 大 成 交 量 的 原则 来 定 出 股票 的 价位 , 这 个 价位 就 被 称 为 集合 竞价 的 价位 。 集合 竞价 的 流程 
大 致 如 下 所 述 。 


(1) 确定 有 效 委 托 。 即 在 涨 跌幅 限制 的 前 提 条 件 下 ， 根 据 该 股 上 一 交易 日 收盘 价 以 及 确定 的 
涨 跌幅 度 来 计算 当日 的 最 高 限 价 、 最 低 限 价 。 

(2) 选取 成 交 价 位 。 在 有 效 价格 范围 内 选取 使 所 有 委托 产生 最 大 成 交 量 的 价位 。 如 有 两 个 以 
上 这 样 的 价位 ， 则 按 如 下 的 规则 选取 成 交 价 位 : 高 于 选取 价格 的 所 有 买 委托 和 低 于 选取 价格 的 
所 有 卖 委 托 能 够 全 部 成 交 ， 与 选取 价格 相同 的 委托 的 一 方 必须 全 部 成 交 。 

(3) 集中 撮合 处 理 所 有 的 买 委托 按照 委托 限 价 由 高 到 低 的 顺序 排列 ， 限 价 相同 者 按照 进入 系 
统 的 时 间 先 后 排列 , 而 所 有 卖 委托 则 按 委托 限 价 由 低 到 高 的 顺序 排列 ， 限 价 相同 者 按照 进入 系统 的 
时 间 先 后 排列 。 

依 序 逐 笔 将 排 在 前 面 的 买 委托 与 卖 委 托 配 对 成 交 ， 即 按照 “价格 优先 ， 同 等 价格 下 时 间 优先 ” 
的 成 交 顺 序 依次 成 交 ， 直 至 成 交 条 件 不 满足 为 止 ， 即 不 存在 限 价 高 于 等 于 成 交 价 的 叫 买 委托 或 
不 存在 限 价 低 于 等 于 成 交 价 的 叫卖 委托 。 所 有 成 交 都 以 同一 成 交 价 成 交 。 

(4) 行情 揭示 。 集 合 竞价 中 未 能 成 交 的 委托 ， 自 动 进入 连续 竞价 。 

集合 竞价 结束 后 ， 交 易 开始 ， 在 上 午 9 点 30 分 到 11 点 30 分 ， 下 午 13 点 到 15 点， 即 进入 连 
续 竞 价 阶 段 。 在 此 期 间 每 一 笔 买卖 委托 进入 电脑 自动 撮合 系统 后 ， 当 即 判断 并 进行 不 同 的 处 理 ， 能 
成 交 者 予以 成 交 ， 不 能 成 交 者 等 待机 会 成 交 ， 部 分 成 交 者 则 让 剩余 部 分 继续 等 待 。 按 照相 关 规 定 ， 
在 无 撤 单 的 情况 下 ， 委 托 当 日 有 效 。 若 遇 到 股票 停牌 ， 停 牌 期 间 的 委托 无 效 。 

连续 竞价 处 理 按时 间 优 先 和 价格 优先 两 个 原则 。 具 体 来 讲 ， 申 买 价 高 于 即时 揭示 的 最 低 卖 价 
以 最 低 申 卖 价 成 交 ， 申 卖 价 低 于 最 高 申 买 价 ， 以 最 高 申 买 价 成 交 。 两 个 委托 如 果 不 能 全 部 成 交 ， 剩 
余 的 继续 留 在 买卖 单 上 ， 等 待 下 次 成 交 。 

从 上 述 竞价 制度 的 描述 来 看 ， 如 果 投 资 者 对 某 股 有 信心 ， 认 为 它 会 涨 ， 想 要 买 进 ， 在 竞价 时 
就 会 申报 一 个 相对 当前 价格 而 言 比较 高 的 价格 ， 这 时 就 会 按 比较 高 的 价格 成 交 ， 于 是 股票 就 涨 了 。 
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相反 ， 如 果 投 资 者 对 某 股 没有 信心 ， 认 为 后 市 会 跌 ， 那 么 就 会 卖 出 。 为 了 尽快 抛售 ， 就 会 定 一 个 低 
于 当前 价 的 卖 单 ， 这 样 一 来 按 竞 价 制度 ， 股 票 就 跌 了 。 


5.1.4 ”指数 与 板块 


股票 指数 即 股 票 价格 指数 ， 是 由 证 券 交 易 所 或 金融 服务 机 构 编 制 的 表明 股票 行 市 变动 的 一 种 
供 参考 的 指示 数字 。 投资 者 通过 指数 的 上 涨 和 下 跌 ， 可 以 判断 出 股票 价格 的 变化 趋势 ， 这 种 股票 指 
数 ， 也 就 是 表明 股票 行 市 变动 情况 的 价格 平均 数 。 

常见 的 指数 有 上 证 综合 指数 ， 深 圳 综合 指数 ， 沪 深 300 指数 ， 香 港 恒生 股票 指数 ， 道 .琼斯 股 
票 指数 和 金融 时 报 股票 价格 指数 等 。 

股票 板块 是 指 某 些 公司 在 股票 市 场 上 有 某 些 特定 的 相关 要 素 ， 就 以 这 一 要 素 命名 该 板块 。 

板块 的 分 类 方式 主要 有 两 类 ， 按 行业 分 类 和 按 概 念 分 类 。 

行业 板块 分 类 是 指 ， 中 国 证 监 会 对 上 市 公司 有 分 类 标准 ， 这 个 是 官方 的 。 每 季度 要 求 对 公司 
大 于 50% 的 业务 来 归 类 公司 所 属 行业 。 这 部 分 内 容 可 以 在 证 监 会 网 站 上 查 到 上 一 个 季度 的 所 有 上 
市 公司 的 行业 分 类 。 

概念 板块 没有 统一 的 标准 。 常 用 的 概念 板块 分 类 法 有 地 域 分 类 : 如 上 海 板块 、 雄 安 新 区 板块 
等 ,还 可 以 按 政策 分 类 ， 比 如 新 能 源 板块 、 自 贸 区 板块 等 ， 按 指数 分 类 可 以 是 ， 沪 深 300 板块 、 上 
证 50 板块 等 ， 按 热点 经 济 分 类 比如 ， 网 络 金融 板块 、 物 联网 板块 等 。 


5.1.5 ”本 书 会 用 到 的 股市 术语 


在 股市 中 通常 都 有 一 些 约定 俗 成 的 词语 来 表示 一 些 特定 的 含义 ， 这 就 是 股市 术语 ， 在 本 书后 
续 的 章节 中 ， 在 验证 基于 各 种 指标 的 买卖 策略 时 ， 也 会 用 到 一 些 术 语 ， 下 面 就 大 致 介绍 一 下 。 
日 “牛市 : 也 称 多 头 市 场 ， 指 人 们 对 市 场 行情 普遍 看 涨 ， 延 续 时 间 较 长 的 大 升 市 。 
日 ”能 市 : 也 称 空头 市 场 ， 指 人 们 对 市 场 行情 普遍 看 淡 ， 延 续 时 间 相 对 较 长 的 大 跌 市 。 
多 头 : 是 指 投资 者 对 股市 前 景 看 好 ， 预 计 股价 就 会 上 涨 而 轿 低 买 进 股票 ， 等 股价 上 涨 至 一 定 
价位 再 卖 出 股票 ， 以 获取 差价 收益 的 投资 行为 。 
@ ”空头 : 是 指 投资 者 对 股市 前 景 看 坏 ， 预 计 股 价 就 会 下 跌 ， 而 轿 高 卖 出 股票 ， 等 股价 下 跌 至 一 
定价 位 再 买 回 股票 ， 以 获取 差价 收益 的 投资 行为 。 
日 利多 : 又 叫 利好 。 是 指 刺 激 股价 上 涨 的 信息 ， 如 上 市 公司 经 营业 绩 好 转 、 银 行 利率 降低 和 市 
场 繁荣 等 ， 以 及 其 他 政治 、 经 济 、 军 事 、 外 交 等 方面 对 股价 上 涨 有 利 的 信息 。 
利空 : 对 于 空头 有 利 ， 能 刺激 股价 下 跌 的 各 种 因素 和 消息 ， 称 为 利空 。 
空仓 : 指 投资 者 将 所 持 有 的 股票 全 部 抛 出 ， 手 中 持 有 现金 而 无 股票 的 状态 。 
建仓 : 指 投资 者 判断 股价 将 要 上 涨 而 开始 买 进 股票 的 投资 行为 。 
满仓 : 是 指 投资 者 将 资金 全 部 买 入 了 股票 而 手中 已 没有 现金 的 状态 。 
减仓 : 是 指 卖 出 手中 持 有 的 股票 ， 减 少 所 拥有 股票 的 数量 。 
仓位 : 是 指 投资 人 实际 投资 和 实 有 投资 资金 的 比例 。 例 如 投资 者 总 的 投资 金额 为 10 万 元 , 现 
在 用 了 5 万 元 买 入 了 股票 ， 那 么 该 投资 者 的 仓位 就 是 50% 。 
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@” 追 涨 : 就 是 当 股票 开始 涨 起 来 时 ， 不 管 价位 是 多 少 都 买 入 股票 的 投资 行为 。 

杀 跌 : 就 是 在 股市 下 跌 的 时 候 ， 不 管 当初 股票 买 入 的 价格 是 多 少 ， 都 立刻 卖 出 ， 以 求 避免 更 
大 的 损失 。 这 种 行为 称 为 杀 跌 。 

@ 长线 : 又 叫 长 线 投资 ， 看 准 一 只 股票 在 长 时 间 内 持 有 它 ， 通 过 它 获 利 的 投资 行为 。 

@ 短线 : 又 叫 短线 投机 ， 在 比较 短 的 时 间 内 ， 比 如 在 几 天 内 ， 甚 至 当天 内 买 进 卖 出 股票 以 获取 
差价 收益 的 投资 行为 。 

@ 主力 : 是 持 股 数 较 多 的 机 构 或 大 户 ， 每 只 股票 都 存在 主力 ， 但 是 不 一 定 都 是 庄家 ， 庄 家 可 以 
操控 一 只 股票 的 价格 ， 而 主力 只 能 短期 影响 股价 的 波动 。 

e@ 筹码 : 投资 人 手中 持 有 的 一 定数 量 的 股票 。 

@ 蓝筹 股 : 是 指 那些 在 其 所 属 行业 内 占有 重要 支配 性 地 位 、 业 绩优 良 ， 成 交 活跃 、 红 利 优 厚 的 
大 公司 的 股票 称 为 蓝筹 股 。 其 特点 是 有 着 优良 的 业绩 、 收 益 稳定 、 股 本 规模 大 、 红 利 优 厚 、 
股价 走势 稳健 、 市 场 形象 良好 。 

”龙头 股 : 在 股票 市 场 的 炒作 中 对 同行 业 板块 的 其 他 股票 具有 影响 和 号 召 力 的 股票 ， 它 的 涨 跌 
往往 对 其 他 同行 业 板 块 股票 的 涨 跌 起 引导 和 示范 作用 。 

”支撑 线 : 又 称 为 抵抗 线 。 当 股价 跌 到 某 个 价位 附近 时 ， 股 价 停止 下 跌 ， 甚 至 有 可 能 回升 ， 这 
是 因为 多 方 在 此 买 入 造成 的 。 支 撑 线 起 阻止 股价 继续 下 跌 的 作用 。 

”阻力 线 : 股价 上 涨 到 达 某 一 价位 附近 ， 股 价 停止 上 扬 ， 甚 至 回 跌 ， 这 是 因为 空 方 在 此 卖 出 造 
成 的 。 阻 力 线 起 阻止 股价 继续 上 涨 的 作用 。 

@ ”技术 指标 | 泛 指 一 切 通过 数学 公式 计算 得 出 的 股票 数据 集合 。 目 前 ， 证 券 市 场 上 的 各 种 技术 
指标 非常 多 ， 例 如 相对 强 弱 指 标 (RSI )、 随 机 指标 (KDJ)、 趋 向 指标 (DMI )、 平 滑 异 同 平 
均线 (MACD )， 等 等 。 

”黄金 交 又 ( 金 又 ) 是 指 上 升 的 中 短期 指标 曲线 由 下 而 上 穿 过 长 期 指标 曲线 , 表示 股价 将 继续 
上 涨 ， 行 情 看 好 。 

@ 死亡 交叉 ( 死 又 ): 是 指 下 降 的 中 短期 指标 曲线 由 上 而 下 穿 过 长 期 指标 曲线 ， 表 示 股 价 将 继续 
下 跌 ， 行 情 看 坏 。 

@ 背离 : 是 指 技术 指标 曲线 的 运动 方向 与 股票 价格 的 运行 方向 不 一 致 。 说 明 股 价 的 变化 没有 得 
到 指标 的 支持 。 背 离 分 为 项 部 背离 和 底部 背离 。 


5.2 ”编写 股票 范例 程序 会 用 到 的 库 


在 Python 语言 的 发 展 过程 中 ，Python 系统 的 开发 者 和 第 三 方 库 的 开发 者 会 把 一 些 常用 的 功能 
封装 到 Python 库 中 ， 比 如 之 前 在 读 写 文件 时 用 到 的 os 和 shutil 库 。 

在 本 章 中 ， 我 们 会 从 网 站 抓 取 数 据 ， 在 后 续 章 节 中 ， 还 会 用 这 些 数 据 绘制 各 种 股票 指标 ， 在 
编写 范例 程序 的 过 程 中 ， 会 用 到 如 表 5-1 所 示 的 库 。 
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表 5-1 编写 股票 相关 范例 程序 会 用 到 的 库 


库 名 功能 点 
pandas datareader 是 一 个 远程 获取 金融 数据 的 Python 工具 ， 是 第 三 方 库 
urllib 可 以 用 来 以 GET 和 了 POST 的 方式 抓 取 网 络 数据 ， 是 Python 标准 库 
Tequests 是 基于 urllib 库 的， 可 以 用 于 抓 取 网 络 数据 ， 是 第 三 方 库 
pandas 是 第 三 方 库 ， 包 含 一 些 标准 的 数据 模型 ， 能 高 效 操作 大 型 数据 集 
re 是 Python 核心 库 ， 封 装 了 处 理 正则 表达 式 的 功能 
是 第 三 方 库 ， 封 装 了 实现 可 视 化 功能 的 方法 ， 在 本 书 内 ， 主 要 通过 它 来 绘制 股 
matplotlib 票 指标 
i Tushare 是 一 个 免费 开源 的 第 三 方 财经 数据 接口 包 , 封装 了 用 于 采集 分 析 和 加 工 
和 股票 等 金融 数据 的 功能 


在 表 5-1 中 ， 除 了 urllib 和 re 是 Python 核心 库 之 外 ， 其 他 都 是 第 三 方 库 ， 都 需要 单独 安装 。 
之 前 我 们 安装 过 NumPy 库 ， 安 装 这 些 库 的 步骤 也 很 相似 。 

切换 到 Python 的 安装 目录 , 笔者 计算 机 中 对 应 的 Python 安装 目录 为 d:/python34, 在 其 中 能 看 
到 Scripts 目录 ,在 “命令 提示 符 ” 窗 口中 通过 命令 行 切换 到 这 个 Scripts 目录 ,而 后 执行 命令 pip install 
-U 库 名 比如 matplotlib) ， 系 统 会 通过 pip 命令 下 载 并 安装 最 新 的 库 。 

下 载 时 ， 如 果 提 示 pip 安装 程序 不 是 最 新 版 ， 则 可 以 执行 如 下 的 命令 更 新 pip: 

Python -m pip install --upgrade pip 

如 果 安 装 的 Python 版 本 和 最 新 的 库 不 兼容 ， 则 可 以 通过 如 下 的 命令 指定 版 本 ， 比 如 指定 安装 
3.0 以 下 的 Matplotlib 库 的 最 新 版 本 : 
pip install -U "matplotlib<3.0" 


5.3 ”通过 候 取 股市 数据 的 范例 程序 
来 学 习 urllib 库 的 用 法 


通过 不 同 的 网 站 〈 即 网 址 ) ， 可 以 收集 到 由 参数 指定 的 股票 数据 ， 比 如 通过 网 易 网 站 对 应 网 
址 ， 可 以 收集 到 指定 股票 在 指定 时 间 范 围 段 内 的 数据 。 

通过 Python 的 核心 库 urllib， 可 以 爬 取 到 网 站 的 数据 ， 事 实 上 ，urllib 库 中 封装 了 网 络 爬 虫 的 
功能 。 


5.3.1 ”调用 urlopen 方法 爬 取 数据 


本 节 将 通过 网 址 http://quotes.money.163.com/service/chddata.html， 以 get 的 方式 请 求 数据 ， 具 
体 的 格式 是 : 
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http://quotes .money.163.com/service/chddata.html?code=0600895&start= 20190101&gend 
=20190110gfields=TCLOSE; HIGH; LOW; TOPEN; CHG; PCHG; TURNOVER; VOTURNOVER; VATURNOVER 


在 表 5-2 中 列 出 了 有 候 取 网 易 网 站 数据 所 使 用 的 各 个 参数 及 其 含义 。 
表 5-2 ” 疏 取 网 易 网 站 数据 所 使 用 的 各 个 参数 及 其 含义 


参数 名 说 明 

code 股票 代码 

| start 抓 取 股票 数据 的 开始 时 间 ， 格 式 是 yyyymmdd | 
end 抓 取 股 票数 据 的 结束 时 间 ， 格 式 是 yyyymmdd 


要 抓 取 的 信息 字段 


网 易 网 站 返回 的 数据 带 有 很 多 字段 ， 下 面 通过 fields 参数 只 抓 取 对 本 书 有 用 的 ， 表 5-3 列 出 了 
fields 参数 所 指定 的 字段 列表 。 
表 5-3 网 易 网 站 返回 的 数据 字段 对 应 表 

参数 名 说 明 

TCLOSE 收盘 价 

HIGH 高 价 

LOW 最 低 价 

TOPEN 开盘 价 

CHG 涨 跌 额 

PCHG 涨 跌幅 

TURNOVER 换 手 率 

VOTURNOVER 成 交 量 

VATURNOVER 成 交 金额 


如 果 直 接 在 浏览 器 中 输入 上 述 url， 则 可 以 看 到 如 图 5-1 所 示 的 csv 格式 数据 ， 根 据 输入 的 参 
数 ， 返 回 了 600895《〈 张 江 高 科 ) 从 2019 年 1 月 1 日 到 1 月 10 日 指定 字段 的 交易 数据 。 
,股票 代码 ,名 从 报 高 价 ， 景 低 价 ， ;五 盘 价 。 01: 演 吃 客 ， 演员 局 ， , 换 手 率 ,成 交 量 , 成 交 金 额 


烤 

各， 2,-5.1186,3.4353,532692999,8291976946 .9 
“699895 ,9 和 Es 1 2 3 16.82,-8.82,-8.1247,3.3991,52641127 ,8446413866 .9 
"699895 ,9 江 高 -804,16.56,15.81,16.28,-8.25,-1.5347,3.5851,55522382,895511548.08 
"699895 ,9 并 高 3 -29,16.65,16.83,16 81,-8.8613,3.8241,59222671,969185655 .8 
“699895 ,9 江 高 : -3,16.58,15.6,15. 8.3695,4.4545,68985635,1189319288.8 
“600895 ,9 江 高 -24,16.65,15.31,1 31,1.946,6.117,94733382,1522854615.8 
2819-81-82,"680895 ,5 并 高 | -93,16.33,14.71,15. 96, 8.98,6.5552,4.9861,75979984,1188528419 .9 


5-1 在 浏览 器 中 请 求 股票 数据 后 返回 的 结果 


通过 调用 Python 中 urllib.request 模块 的 urlopen 方法 ， 可 以 从 上 述 网 站 获取 数据 ， 在 下 面 的 
urllibDemo.py 范例 程序 中 将 示范 仆 取 数据 的 基本 编程 逻辑 。 


下 # coding=utf-8 

2 import urllib.request # 导入 库 

3 stockCode = '600895' # 要 爬 取 的 股票 “张江 高 科 ” 所 对 应 的 股票 代码 

4 url = 'http://quotes.money.163.com/service/chddata.html?code=0'+stockCode+ 


\'gstart=20190102gend=20190102gfields=TCLOSE;HIGH; LOW; TOPEN; CHG; PCHG; TURNO 
VER; VOTURNOVER; VATURNOVER' 
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print (url) # 打印 出 要 疏 取 的 url 
# 调用 urlopen 方法 爬 取 数据 
response = urllib.request.urlopen (url1) 
# 由 于 返回 结果 中 有 中 文 ， 因 此 要 用 gbk 解码 
Print (response.read() .decode ("gbk")) 

0 response.close();  # 关闭 对 象 


在 第 4 行 中 指定 了 要 怜 取 网 站 的 url 地 址 ,其 中 使 用 了 拼接 参数 的 方式 来 指定 爬 取 股票 的 信息 。 
在 第 7 行 中 调用 了 urlopen 方法 ， 传 入 的 参数 是 刚才 拼接 后 的 url。 

第 9 行 通过 urlopen 返回 的 response 对 象 调 用 它 的 read 方法 来 输出 爬 取 到 的 数据 , 由 于 返回 数 
据 里 有 中 文字 符 ， 因 此 要 调用 decode("gbk") 方 法 进行 转 码 。 在 完成 怜 取 数据 后 ， 应 当 像 第 10 行 那 
样 ， 调 用 close 方法 关闭 怜 取 所 用 到 的 response 对 象 。 

运行 这 个 范例 程序 ， 可 以 看 到 如 下 所 示 的 3 行 输出 ， 其 中 第 一 行 输出 了 怜 取 股 票数 据 所 用 到 
的 url 地 址 ， 后 两 行 则 是 输出 了 疏 取 到 的 结果 ， 疏 取 的 结果 和 使 用 浏览 器 看 到 的 是 一 致 的 。 

http://quotes.money.163.com/service/chddata.html?code=0600895&start= 
20190102gend=20190102gfields=TCLOSE;HIGH; LOW; TOPEN; CHG; PCHG; TURNOVER; 
VOTURNOVER; VATURNOVER 

日 期 ,股票 代码 ,名 称 , 收盘 价 , 最 高 价 , 最 低 价 , 开盘 价 , 涨 跌 额 , 涨 跌幅 , 换 手 率 , 成 交 量 , 成 交 金额 

2019-01-02,'600895, 张江 高 


科 ,15.93,16.33,14.71,15.06,0.98,6.5552,4.9061,75979904， 
1188520419.0 


Po o ~aum 


5.3.2 ”调用 带 参 数 的 urlopen 方法 有 爬 取 数据 


在 5.3.1 小 节 中 , 在 调用 urlopen 方法 时 ， 是 直接 传 入 了 一 个 很 长 的 经 过 拼接 的 url 地 址 ， 其 实 
urlopen 方法 还 支持 如 下 的 参数 传 入 方式 。 
urllib.request.urlopen (url,data=None, [timeout]) 


其 中 url 表示 要 访问 网 站 对 应 的 网 址 ，data 则 表示 要 提交 的 数据 ， 在 调用 过 程 中 可 以 用 它 来 传 
入 参数 ， 而 timeout 则 表示 访问 url 网 站 的 超时 时 间 ， 单 位 是 秒 。 

在 下 面 的 urllibWithParam.py 范例 程序 中 , 用 到 了 urlopen 方法 的 data 和 timeout 参数 ， 从 效果 
上 来 看 ， 输 入 参数 并 没有 带 一 串 很 长 的 字符 串 ， 这 样 代 码 的 可 读 性 就 提高 了 。 


bh # coding=utf-8 

之 import urllib.request 

3 stockCode = '600895' # 张江 高 科 

4 ”# 请 注意 ，url 后 没 通过 问号 来 传 各 种 参数 

5 url = 'http://quotes.money.163.com/service/chddata.html' 

6 ”# 参数 是 通过 url .parse 的 方式 来 传 入 的 

水 Param = bytes (urllib.parse.urlencode({'code': '0'+stockCode,'start': 
'20190102','end':'20190102',"'fields':'TCLOSE;HIGH; LOW; TOPEN; CHG; PCHG; TURNO 
VER; VOTURNOVER; VATURNOVER'}), encoding="'utf8') 

8 ”# 带 各 种 参数 

9 response = urllib.request.urlopen (url,data=param,timeout=1) 

10 print(response.read() .decode ("gbk")) 

11 response.close(); 
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第 5 行 的 url 地 址 只 有 主干 , 没有 再 通过 问号 来 传 入 各 种 参数 。 在 第 7 行 中 通过 urllib.parse 来 
整合 各 种 输入 参数 ， 输 入 参数 的 格式 是 ' 键 " 值 '， 中 间 用 逗号 分 隔 ， 比 如 
'start:'20190102','end':’20190102'。 

请 注意 第 9 行 的 urlopen 方法 ， 在 其 中 通过 data 传 入 了 参数 ， 通 过 timeout 传 入 了 超时 时 间 ， 
调用 之 后 同样 执行 第 10 行 的 代码 来 输出 结果 ， 第 11 行 的 代码 则 用 于 关闭 对 象 。 


5.3.3 GET 和 POST 的 差别 和 使 用 场景 


在 5.3.1 小 节 的 urllibDemo.py 范例 程序 中 ， 是 在 url 地 址 之 后 通过 问号 来 拼接 参数 ， 其 实 这 是 
通过 GET 方式 来 请 求 数据 ， 而 在 5.3.2 小 节 的 urllibWithParam.py 范例 程序 中 ， 是 通过 data 来 传 入 
参数 ， 这 其 实 是 POST 方式 。 

GET 和 POST 都 是 基于 HTTP 协议 的 请 求 方式 ，GET 把 请 求 的 数据 〈 包 括 主体 和 参数 ) 放 在 
url 中 ，POST 则 把 数据 放 在 HTTP 数据 包 中 。GET 提交 的 数据 尺寸 最 大 为 2KB， 而 POST 在 理论 
上 数据 包 的 大 小 没有 限制 。 

综合 比较 下 来 ， 通 过 GET 方式 传输 的 成 本 比较 小 ， 但 由 于 会 暴露 参数 ， 因 此 一 般 用 于 发 送 参 
数 无 需 加 密 的 请 求 ， 但 如 果 要 传送 密码 等 安全 性 比较 高 的 参数 时 ， 就 不 适宜 用 GET 方式 了 ， 而 建 
议 用 POST 方式 。 


5.3.4 调用 urlretrieve 方法 把 他 取 结 果 存 入 csv 文件 


通过 网 站 扑 取 到 的 数据 应 当 存 入 到 csv 等 格式 的 文件 中 ,以 作为 后 续 绘制 股票 指标 的 基础 , 调 
用 urllib.request.urlretrieve 方法 就 可 以 把 请 求 获 得 的 数据 存 入 指定 的 目录 中 。 

该 方法 的 定义 如 下 ， 其 中 url 表示 要 怜 取 数 据 的 网 站 网 址 ，filename 表示 怜 取 数 据 存 入 的 文件 
名 ， 而 data 则 表示 怜 取 时 要 传 入 的 参数 。 

urlretrieve (url，filename= 文 件 名 ，data= 参 数 对 象 ) 


在 getStockAsCsv.py 范例 程序 中 示范 了 通过 调用 urlretrieve 疏 取 股票 数据 并 存 入 csv 文件 的 程 
序 编写 逻辑 。 
# coding=utf-8 
import urllib.request 
def getAndSaveStock (stockCodeList,path): 
for stockCode in stockCodeList: 

url = 'http://quotes.money.163.com/service/chddata.html' 

Param = bytes (urllib.parse.urlencode({'code': '0'+stockCode, 
'start':'20190101','end':"'20190131','fields':"'TCLOSE;HIGH; LOW; TOPEN; CHG; PC 
HG; TURNOVER; VOTURNOVER; VATURNOVER'}), encoding="'utf8') 

a urllib.request.urlretrieve (url, pathtstockCodet+' .csv',data=param) 
8 ”# 定义 要 扑 取 的 股票 列表 

9 stockCodeList = [] 

10 stockCodeList.append('600895') # 张江 高 科 

11 stockCodeList.append('600007') # 中 国 国 贸 

12 getAndSaveStock(stockCodeList,'d:\\stockData\\ch5\\') 


和 
2 
3 
4 
5 
6 


74 | ”基于 股票 大 数据 分 析 的 Python 入 门 实战 ( 视频 教学 版 ) 


从 第 3 行 到 第 7 行 的 程序 语句 定义 了 实现 怜 取 并 存 入 怜 取 结果 的 getAndSaveStock 方法 , 该 方 
法 的 参数 是 要 疏 取 的 股票 列表 和 结果 文件 的 存储 路 径 。 

该 方法 的 第 5 行 语句 定义 了 是 从 网 易 网 站 有 候 取 数据 ， 由 于 本 次 是 采用 POST 的 方式 ， 因 此 在 
url 之 后 并 没有 通过 问号 来 拼接 参数 。 第 6 行 的 语句 与 之 前 一 样 , 传 入 息 取 数据 所 用 到 的 各 种 参数 ， 
这 些 参数 表明 要 疏 取 2019 年 1 月 份 的 数据 。 第 7 行 的 程序 语句 调用 了 urlretrieve 方法 ， 把 疏 取 到 
的 数据 存储 到 用 path+stockCodet'csv' 指定 的 文件 中 。 

从 第 10 行 到 第 11 行 的 程序 语句 ,在 stockCodeList 对 象 中 放 入 了 两 个 股票 代码 ,分 别 是 600895 
张江 高 科 和 600007 中 国 国贸 。 第 12 行 的 程序 语句 调用 getAndSaveStock 方法 执行 仆 取 操作 。 这 个 
范例 程序 执行 后 ， 在 D:\stockData\ch5 目录 中 ， 就 能 看 到 两 个 csv 的 文件 ， 如 图 5-2 所 示 。 


如 0 ffice 全 
218 a 


图 5-2 疏 取 后 结果 存储 的 文件 
打开 其 中 任意 一 个 文件 ， 就 能 看 到 该 股票 在 2019 年 1 月 的 交易 数据 。 


5.4 ”通过 基于 股票 数据 的 范例 程序 学 习 正 则 表达 式 


在 息 取 数据 时 ， 一 般 需要 对 返回 结果 进行 处 理 ， 这 时 就 需要 用 到 正则 表达 式 。 
正则 表达 式 (Regular Expression， 简 写 为 regex、regexp 或 RE) ， 通 常用 来 搜索 和 替换 符合 特 
定 规则 的 文本 。 在 Python 语言 中 ， 是 在 re 库 里 封装 了 正则 表达 式 的 相关 方法 。 


5.4.1 用 正则 表达 式 匹 配 字符 串 


在 开发 过 程 中 ， 经 常会 遇 到 针对 字符 串 的 匹配 蔡 换 和 截取 操作 ， 比 如 匹配 某 个 字符 串 是 否 全 
都 是 数字 , 或 者 是 截取 字符 串 中 用 引号 括 起 来 的 内 容 ， 此 类 需求 可 以 通过 正则 表达 式 来 实现 。 在 下 
面 的 regexMatchDemo.py 范例 程序 中 列 出 了 正则 表达 式 “ 匹 配 规 则 ”的 用 法 。 


1 import re # 导入 库 

这 numStr = "1c" 

3 “numPattern = '!^[0-9]+$"# 匹配 数字 的 正则 表达 式 

4 if re .match (numPattern,numStr): 

5 Print('All Numbers') 

6 lowCaseStr = 'abc' 

7 ”strPattern ='^[a-z]+$'# 匹配 小 写字 母 的 正则 表达 式 
8 if re.match (strPattern, 1owCaseStr) : 

9 Print('All Low Case') 

10 stockPattern='^[61310] [0-9]{5}$'  ## 匹配 沪 深 A 股 主板 和 创业 板 股 票 
11 stockCode='300000' 

12 if re.match(stockPattern,stockCode): 

13 print('Is Stock Code') 
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在 这 个 范例 程序 的 第 3 行 ， 第 7 行 和 第 10 行 中 ， 分 别 定义 了 三 个 匹配 规则 ， 在 随后 第 4 行 ， 


第 8 行 和 第 12 行 中 ， 


调用 re.match 方法 进行 了 匹配 。 


而 第 10 行 用 于 匹配 沪 深 A 股 主板 和 创业 板 的 正则 表达 规则 是 ， 以 6( 沪 )、3 (创业 板 ) 或 0 


( 深 ) 开头 ， 后 面 跟 


5 位 数字 ， 具 体 规 则 的 含义 可 参考 表 5-4 的 说 明 。 


在 三 个 匹配 规则 中 ,可 以 看 到 一 些 用 于 判断 规则 的 正则 字符 ,在 表 5-4 中 ,归纳 了 一 些 常用 的 


正则 字符 的 含义 。 


条 全 


^ 开始 标记 ^[0-9]+$， 其 中 人 ^ 的 含义 是 以 0~9 的 数字 开始 
、 结束 标记 ^[0-9]+$， 其 中 $ 的 含义 是 以 0~9 的 数字 结尾 
+ 匹配 1 次 或 多 次 ^[0-9]+$，+ 的 含义 是 0-9 的 数字 出 现 1 次 或 多 次 


匹配 1 次 或 多 次 ， 也 能 


匹配 空 字符 串 
3.re.match("“[0-9]*S$''c')， 目 标 字符 串 是 字母 ， 不 能 匹配 上 
^[0-9]+$， 其 中 ^ 的 含义 是 以 0~9 的 数字 开始 ， 这 里 [0-9] 表 示 包 
含 0-9 的 字符 集 ， 也 就 是 数字 。 
0 表示 一 个 字符 集 结合 其 他 正则 字符 , 这 个 表达 式 的 规则 是 : 以 0~9 的 数字 开头 ， 


表示 小 写字 母 集 ， 同 理 | ^[a-zj+$， 则 表示 以 小 写字 母 开头 和 结尾 ， 中 间 小 写字 母 出 现 1 
A-Z 表示 大 写字 母 集 次 或 多 次 ， 也 就 是 说 匹配 目标 字符 串 是 否 都 是 小 写字 母 


| 表示 “或 比如 [6l3|0]， 则 表示 该 字符 要 么 是 6， 要 么 是 3， 要 么 是 0 
^[63|0][0-9]{5}$， 其 中 [0-9]{5} 需 要 连 起 来 解读 , 说 明 匹 配 数字 

0 匹配 指定 字符 n 次 5 次 ， 这 个 表达 式 规则 的 完整 含义 是 : 以 6、3 或 0 开头, 后 面 
连接 5 位 数字 


表 5-4 常用 正则 字符 一 览 表 


1.re.match(^[0-9]*$,")， 目 标 字符 串 是 空 ， 能 匹配 上 
2.re.match(“[0-9]*$,'0)， 目 标 字符 串 是 数字 ， 能 匹配 上 


以 0-9 的 数字 结尾 ， 该 数字 字符 出 现 一 次 或 多 次 ， 归 纳 起 来 就 
是 匹配 数字 


Python 中 用 正则 表达 式 匹配 字符 串 的 一 般 用 法 如 下 。 


myStz = 'n' 


心 w_ N 


其 中 第 1 行 是 要 


myPattern = '^[0-9]*$" 
if re.match (myPattern,myStr): 
print('Match') 


匹配 的 字符 串 ， 第 2 行 表示 匹配 的 规则 ， 在 第 3 行 中 ， 调 用 match 方法 来 匹 


配 。 还 可 以 利用 上 述 正则 字符 定义 的 其 他 规则 ， 比 如 要 定义 判断 是 否 是 手机 号 码 的 规则 ， 那 么 
myPattern 就 可 以 这 样 写 : ^1[3|4|5|7|8][0-9]{9}$， 以 1 开头, 第 2 位 是 3 或 4 或 5 或 7 或 8， 再 跟 上 
9 位 数字 ( 共 11 位 数字 ) 。 
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5.4.2 ”用 正则 表达 式 截取 字符 串 


当 用 urlopen 等 方式 获取 网 络 数据 后 ， 有 时 需要 再 处 理 一 下 ， 常 见 的 场景 有 如 下 三 种 : 
@ ”获取 某 个 字符 (比如 等 号 ) 右边 或 左边 或 两 边 的 字符 囊 。 

@ ”获取 菜 对 字符 (比如 左 括号 右 括号 对 或 者 引号 对 ) 中 间 的 字符 串 。 

@ 用 特定 字符 (比如 过 号 ) 分 隔 字 符 囊 ， 把 分 隔 结 果 放 入 数组 。 


在 下 面 的 regexSplitDemo.py 范例 程序 中 将 演示 正则 表达 式 的 上 述 用 法 。 


1 # coding=utf-8 

2 import re 

3 ”# 以 等 号 分 隔 ， 输 出 等 号 两 边 的 字符 串 [ 'content '， 'Hello World'] 
4 Print (re.split('='， content=Hello World')) 

5 ”# 输出 等 号 左边 的 字符 串 content 

6 Print (re.split('=',"'content=Hello World') [0]) 

7 ”# 输出 等 号 右边 的 字符 串 Hello World 

8 Print (re.split('=',"'content=Hello World') [1]) 

9 


10 str = 'content=code: (600001),price: (20)"' 
11 pattern = re.compile(r'[(](.*?)[)]') 

12 ”# 输出 括号 内 的 所 有 内 容 ['600001'，'20'] 

13 print(re.findall (pattern, str)) 


15 ## 获取 <> 之 间 的 所 有 内 容 

16 rule = r'<(.*?)>" 

17 result = re.findall (rule, 'content=<123>') 
18 print(result) # 输出 ['123'] 


20 ”# 获取 引号 之 间 的 内 容 

2 Pole. mr i 

22 result = re.findall (rule, 'content="456"') 
23 print(result) # 输出 ['456'] 


25 ”# 用 逗号 分 隔 

26 str='!600001,10,12,15， 

27 item=re.split(',',str) 

28 print (item) # 输出 ['600001'，'10'，'12',，'15"] 

在 第 4 行 、 第 6 行 和 第 8 行 中 ， 调 用 了 re.split 方法 ， 把 字符 串 按照 等 号 进行 分 隔 ， 该 方法 返 
回 的 是 列表 , 从 第 6 行 和 第 8 行程 序 语句 的 输出 看 , re.split 返回 的 列表 中 分 别 包 含 了 等 号 左边 和 右 
边 的 字符 串 。 

在 第 10 行 到 第 13 行 的 程序 代码 中 ， 是 从 字符 串 中 截取 了 小 括号 之 间 的 内 容 ， 具 体 做 法 是 ， 
调用 第 11 行 的 re.compile 方法 定义 了 字符 串 截 取 的 规则 , 在 第 13 行 中 调用 re.findall 方法 , 把 按 规 
则 截取 的 字符 串 放 入 了 列表 中 并 输出 。 

在 第 15 行 到 第 18 行 以 及 第 20 行 到 第 23 行 之 间 的 程序 代码 ， 分 别 实现 了 “截取 ”字符 串 的 


第 5 章 股市 的 常用 知识 与 数据 准备 | 77 


另外 一 种 用 法 ， 即 通过 rule =r<(.*?)>' 定 义 规则 ， 该 规则 表示 匹配 “<” 和 “>” 之 间 的 所 有 字符 串 ， 随 
后 调用 findall 方法 来 查找 符合 规则 的 字符 串 。 如 果 把 规则 改 成 z"(.*9)"， 则 是 截取 引号 内 的 字符 串 。 

从 第 25 行 到 第 27 行 的 程序 语句 实现 了 “ 按 逗 号 分 隔 ” 字 符 串 的 功能 ， 是 通过 调用 re.split 方 
法 实现 的 ， 该 方法 的 返回 结果 也 是 列表 ,在 执行 第 28 行 的 print 语句 之 后 ， 即 可 看 到 字符 串 截 取 的 
结果 。 


5.4.3 ”综合 使 用 爬虫 和 正则 表达 式 


在 之 前 的 范例 程序 中 是 调用 urllib 核心 库 中 的 方法 来 息 取 数据 ， 事 实 上 还 可 以 调用 urllib 库 的 
升级 版 requests 库 中 的 方法 来 息 取 数据 。 

下 面 的 范例 向 http://hq.sinajs.cm/list=sh600895 这 个 新 浪 的 网 址 请 求 数据 ， 其 中 ，list= 之 后 跟 的 
是 要 请 求 其 交易 数据 的 股票 代码 ， 如 果 是 沪 股 ， 前 面 需 要 加 sh 作为 前 级 。 在 浏览 器 中 输入 该 请 求 
后 ， 可 以 看 到 如 下 的 返回 结果 。 

var hq_str_sh600895=" 张 江 高 科 , 13.910,13.800,14.200,14.240,13.870,14.200, 
14.210,19546288,274647248.000,35900,14.200,82825,14.190,202300,14.180,168400, 


14.170,25100,14.160,225200,14.210,78800,14.220,45500,14.230,64977,14.240, 
128600,14.250,2019-02-01,15:00:00,00"; 


也 就 是 说 ， 在 等 号 之 后 的 引号 中 包含 了 最 近 一 个 交易 日 的 交易 数据 。 由 于 本 书 的 范例 程序 中 
不 是 从 这 个 网 址 获取 数据 ， 因 此 就 不 解析 这 些 数据 的 含义 了 。 在 下 面 的 getFromSinaAPI.py 范例 程 
序 中 ， 将 示范 通过 requests 库 爬 取 数据 并 用 正则 表达 式 整 理 返回 结果 。 


# coding=utf-8 

2 import requests 

| import re 

4 ”# 定义 疏 取 打印 和 保存 数据 的 方法 

号 def printAndSaveStock (code): 

6 url = 'http://hq.sinajs.cn/list=' + code 

可 response = requests.get (url) .text 

8 DTe ru # 设置 截取 字符 串 的 规则 

9 result = re.findall (rule, response) 

10 print (result [0]) 

11 filename = 'D:\\stockData\\ch5\\'+codet".csv" 
12 f = open(filename, 'w') 

3 # findall 方法 返回 的 是 列表 ， 这 里 第 0 号 索引 存放 所 需 的 内 容 
14 .write(result[0]) # 写 文件 

bs f.close() # 关闭 文件 


16 ”# 扑 取 张江 高 科 和 中 国 国贸 这 两 只 股票 的 交易 数据 
17 codes = ['sh600895', 'sh600007'] 
18 for code in codes: 
19 printAndSavestock (code) 

在 第 5 行 的 printAndSaveStock 方法 中 封装 了 扑 取 、 打 印 和 保存 数据 的 功能 。 其 中 在 第 6 行 中 
定义 了 要 获取 数据 的 对 应 网 站 的 url 地 址 , 在 第 7 行 通过 response = requests.get(url).text 的 方式 ， 从 
指定 的 url 网 站 中 获取 了 返回 的 文本 , 根据 从 浏览 器 中 观察 到 的 效果 , 我 们 只 需要 引号 之 间 的 内 容 ， 
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所 以 在 第 8 行 中 定义 了 字符 串 截 取 的 规则 ， 在 第 9 行 通 过 调用 re.findall 方法 获取 所 需 的 内 容 。 

请 注意 ， 由 于 re.findall 方法 返回 的 是 一 个 列表 ， 而 在 返回 的 结果 中 包含 在 引号 内 的 文本 数量 
只 有 1 个 ， 因 此 需要 像 第 10 行 那 样 ， 用 result[0] 的 索引 方式 获取 字符 串 的 内 容 。 

从 第 11 行 到 第 15 行 的 程序 语句 ， 把 结果 写 入 到 指定 的 文件 中 ， 写 完 后 调用 close 方法 关闭 文 
件 对 象 。 这 部 分 的 代码 在 之 前 的 章节 里 已 经 讲 过 ， 这 里 就 不 再 详 述 了 。 

在 第 17 行 中 定义 了 两 个 要 的 取 的 股票 列表 ， 分 别 是 sh600895〈 张 江 高 科 ， 需 要 以 sh 为 前 缀 ) 
和 sh600007 (中 国 国 贸 ) ， 在 第 18 行 和 第 19 行使 用 for 循环 执行 仆 取 并 存储 这 两 个 股票 相关 数据 
的 操作 。 

运行 这 个 范例 程序 之 后 , 就 能 在 控制 台中 看 到 疏 取 后 往 csv 文件 中 写 入 的 内 容 , 如 图 5-3 所 示 ， 
从 中 可 以 看 到 ， 只 有 引号 之 间 的 内 容 被 写 入 了 文件 。 

:I Console x PyUnit 


Cterminated> D;\softw b\ 清 华 出 版 社 \PythonforkSpace\charter5\src\getFromSinaAPI. py 
江 高 科 ， 


3.220,13.3 13. 


图 5-3 ”范例 程序 运行 的 结果 


在 Di\stockData\ch5 目录 中 还 能 看 到 sh600895.csv 和 sh600007.csv 这 两 个 csv 文件 ， 这 两 个 文 
件 中 的 内 容 和 在 控制 台 上 输出 的 内 容 是 一 致 的 。 

在 这 个 范例 程序 中 ， 我 们 只 是 从 结果 中 抓 取 了 引号 之 间 的 内 容 ， 但 在 5.4.2 小 节 中 ， 我 们 讲述 
了 抓 取 其 他 格式 字符 串 的 方式 。 在 用 urllib 或 requests 等 库 爬 取 网 络 数据 时 ， 大 家 可 以 根据 返回 数 
据 的 格式 ， 通 过 定义 不 同 的 截取 规则 得 到 所 需 格式 的 数据 。 


5.5 通过 第 三 方 库 收 集 股市 数据 


在 之 前 的 范例 程序 中 ， 通 过 urllib 或 requests 等 库 ， 以 输入 url 的 方式 从 指定 网 站 获取 数据 。 
而 事实 上 , 一 些 诸如 pandas_datareader 和 Tushare 等 的 Python 第 三 方 库 也 提供 了 一 些 获取 股市 数据 
的 方法 。 

本 书 无 意 于 比较 各 种 获取 股市 数据 的 方式 ， 而 着 意 于 列 出 各 种 获取 数据 的 方式 ， 以 便 读 者 可 
以 根据 具体 的 项 目 需求 ， 灵 活 地 选用 合适 获取 数据 的 方式 。 


5.5.1 通过 pandas_ datareader 库 获 取 股 市 数据 


pandas_datareader 是 一 个 能 读 取 各 种 金融 数据 的 库 ， 在 下 面 的 getDataByPandasDatareader.py 
范例 程序 中 演示 了 通过 这 个 库 获 取 股 市 数据 的 常规 方法 。 


# coding=utf-8 

import pandas datareader 

code='600895.ss' 

stock = pandas datareader.get data yahoo(code,'2019-01-01',"'2019-01-30') 
print (stock) # 输出 内 容 


ao 心 wwN 
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6 ”# 保存 为 excel 和 csv 文 件 
光 stock.to excel('D:\\stockData\\ch5\\'+codet+' .xlsx') 
8 stock.to csv('D:\\stockData\ch5\\'+codet'.csv') 


从 这 个 范例 程序 的 代码 上 来 看 ， 不 算 复 条， 从 中 没有 见 到 疏 取 网 站 之 类 的 代码 。 关 键 的 是 第 4 

行 ， 通 过 调用 pandas_datareader.get_data_yahoo 方法 从 雅虎 网 站 获取 数据 ， 这 个 方法 的 参数 分 别 是 
票 代码 ， 开 始 日 期 和 结束 日 期 。 

在 这 个 范例 程序 中 获取 了 600895 (张江 高 科 ) 2019 年 1 月 份 的 数据 ， 虽 然 结束 时 间 是 1 月 30 
日 ， 但 从 结果 中 能 看 到 1 月 31 日 的 数据 。 

在 第 7 行 和 第 8 行 分 别 调用 了 to_excel 和 to_csv 方法 ， 把 结果 存 入 了 指定 目录 下 的 文件 中 。 
这 个 范例 程序 运行 后 ， 我 们 首先 能 在 控制 台中 看 到 输出 ， 其 次 会 在 D:\stockData\ch5\ 目 录 中 ， 看 到 
600895.ss.xlsx 和 600895.ss.csv 这 两 个 保存 股票 数据 的 文件 。 打 开 600895.ss.xlsx 文件 ， 能 看 到 如 图 
5-4 所 示 的 数据 内 容 ， 其 实在 控制 台中 和 另 一 个 csv 文件 中 ， 可 以 看 到 一 样 的 数据 。 


High | Low | Open | Close [Yoluae|[ Adi Close 


2019-01-02 0: 16.33 14.71 15. 06 15. 93 75979904 15.93000031 
2019-01-03 0: 16.65 15.31 15.78 16. 24 94733382 16.23999977 
2019-01-04 0: 16. 58 15.6 15.7 16.3 68985635 16. 29999924 
2019-01-07 0: 16.65 15.6 15.7 16. 29 59222671 16.29000092 
2019-01-08 0: 16.56 15.81 16. 28 16. 04 55522302 16.04000092 
2019-01-09 0: 16. 33 15.75 16. 02 16. 02 52641127 16. 02000046 
2019-01-10 0: 16. 11 15.12 15. 88 15.2 53202090 15. 19999981 
2019-01-11 0: 15.8 15. 06 15.2 15. 56 42057493 15.56000042 
2019-01-14 0: 16.08 15. 35 15.67 15. 46 43255147 15. 46000004 
2019-01-15 0: 15.64 15.09 15.4 15.54 31687291 15.53999996 
2019-01-16 0: 16.17 15. 46 15.75 15.71 44711686 15.71000004 
2019-01-17 0 17,05 15.6 15.6 16. 98 86309543 16.97999954 
2019-01-18 0 16.8 16.05 16.72 16.29 62198832 16.29000092 
2019-01-21 0 16. 53 15. 92 16. 22 16.4 38675827 16. 39999962 
2019-01-22 0 16. 91 16. 22 16. 3 16. 36 47087722 16. 36000061 
2019-01-23 0: 16. 68 15. 91 16. 36 16.4 40190374 16. 39999962 
2019-01-24 0: 16. 65 15. 93 16. 65 16. 07 39457212 16. 06999969 
2019-01-25 0: 16. 04 15. 27 15. 92 15. 33 42175769 15. 32999992 
2019-01-28 0 15.57 15.21 15.5 15. 35 21769886 15.35000038 
2019-01-29 0 15.5 14.18 15.27 14.54 31401261 14.53999996 
2019-01-30 0 14.77 14.33 14.49 14.37 16274136 14.36999989 
2019-01-31 0: 14.75 13.58 14.69 13.8 32695437 13.80000019 


图 54 用 pandas_datareader 库 获得 股票 数据 的 效果 图 
而 返回 数据 的 表 头 含义 如 表 5-5 所 示 的 字段 。 
表 5-5 字段 对 应 表 


吾 


在 上 述 范例 程序 中 ， 在 调用 get_data_yahoo 方法 时 ， 传 入 的 股票 代码 带 有 .ss 的 后 组 ， 这 表示 
该 代码 是 沪 股 的 。 此 外 ， 还 能 通过 .sz 的 后 缀 来 表示 深 股 ,通过 .hk 的 后 级 表示 港股 。 如 果 要 获取 美 
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股 的 数据 ,， 则 直接 用 美股 的 股票 代码 即 可 。 在 下 面 的 printDataByPandasDatareader.py 范例 程序 中 演 
示 了 获取 美股 ， 港 股 和 深 股 相关 数据 的 方式 。 


下 # coding=utf-8 

2 import pandas datareader 

3 stockCodeList = [] 

4 stockCodeList.append('600007.ss') # 沪 股 “中 国 国贸 ” 

5 stockCodeList.append('000001.sz') # 深 股 “平安 银行 ” 

6 stockCodeList.append('2318.hk') # 港股 “中 国平 安 ” 

7 stockCodeList.append('IBM') # 美股 ，IBM， 直 接 输入 股票 代码 不 带 后 缀 
8 for code in stockCodeList: 

9 # 为 了 演示 ， 只 取 一 天 的 交易 数据 

10 stock = pandas datareader.get data yahoo(code,'2019-01-02','2019-01-02') 
和 节 print (stock) 


这 个 范例 程序 的 代码 是 第 10 行 ， 即 调用 get_data_yahoo 方法 获得 数据 。 在 第 4 行 到 第 7 行 添 
加 要 获取 股票 数据 的 股票 列表 时 ， 分 别 设置 了 要 获取 沪 股 ， 深 股 ， 港 股 和 美股 的 股票 数据 ， 设 置 时 
请 注意 股票 代码 的 后 级 。 

这 个 范例 程序 运行 后 ， 就 能 从 控制 台中 看 到 输出 的 4 个 股票 在 指定 日 期 内 的 交易 情况 ， 由 于 
数据 量 比较 多 ， 本 书 就 不 罗列 具体 的 数据 了 。 


5.5.2 ”使 用 Tushare 库 来 获取 上 市 公司 的 信息 


Tushare 是 一 个 免费 的 用 于 Python 的 财经 数据 接口 包 (或 称 为 库 ) ， 它 的 官网 是 
http://tushare.org/， 在 官网 上 ， 我 们 可 以 看 到 如 下 的 描述 : 

Tushare 是 一 个 免费 、 开 源 的 Python 财经 数据 接口 包 。 主 要 实现 对 股票 等 金融 数据 从 数据 采集 、 
清洗 加 工 到 数据 存储 的 过 程 ， 能 够 为 金融 分 析 人 员 提 供 快速 、 整 洁 、 和 多 样 的 便于 分 析 的 数据 ， 为 
他 们 在 数据 获取 方面 极 大 地 减轻 工作 量 ， 使 他 们 更 加 专注 于 策略 和 模型 的 研究 与 实现 上 。 

我 们 可 以 通过 调用 Tushare 库 中 的 方法 来 获取 各 种 有 帮助 的 数据 。 在 下 面 的 
getStockInfoByTS.py 范例 程序 中 ,将 示范 调用 get_stock_basis 方法 来 获取 各 上 市 公司 的 信息 ,具体 
的 程序 代码 如 下 。 


证 # coding=utf-8 


2 import tushare as ts # 导入 库 

3 ”# 指定 保存 的 文件 名 

4 fileName='D:\\stockData\\ch5\\stockListByTs.csv' 

5 stockList=ts.get stock basics () # 调用 方法 得 到 信息 
6 printl(stockList) # 在 控制 台 打 印 

7 stockList.to_csv(fileName,encoding='gbk') # 保存 到 csv 中 


第 5 行 的 程序 语句 调用 了 get_stock_basis 方法 ,第 6 行 的 程序 代码 在 控制 台 里 输出 了 相关 信息 ， 
而 在 第 7 行 则 是 通过 调用 to_csv 方法 把 信息 保存 到 指定 的 csv 文件 中 ， 由 于 文件 中 含有 中 文字 符 ， 
因此 需要 指定 编码 为 gbk。 

打开 对 应 的 csv 文件 ， 就 能 看 到 上 市 公司 的 详细 信息 ， 由 于 返回 的 字段 和 记录 数 比较 多 ， 因 此 
图 5-5 展示 出 的 只 是 该 csv 文件 中 的 部 分 数据 。 
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[code nane industry area pe outstanditotals totalAsseliquidAssfixedAssereserved 
2947 H 恒 铬 达 “元 器 件 ”江苏 28. 64 0.3 1. 22 62481. 23 47050. 62 12937. 01 19640.3 
2218 拓 日 新 能 半导体 ”深圳 39.93 12.16 12.36 630969.4 227080 293907 131576.1 
600537 亿 晶 光电 半导体 浙江 43.93 11.76 11.76 680322.4 315329.6 317004.4 128309.5 
300167 迪 威 迅 ”通信 设备 深圳 0 3 3 117731.2 65099.73 6401.46 31287. 58 
2681 音 达 科技 “家 用 电器 深圳 22.53 11.05 20.65 877962.6 303593. 8 99794. 32 270590.4 
2333 罗 普 斯 金 铝 江苏 0 4.85 5. 03 155933. 2 50139. 26 78160.71 45438. 65 
2113 天 润 数 娱 互联 网 ”湖南 78.46 8.25 15.33 312240 119134 402.05 124397.1 
300023 宝 德 股份 专用 机 械 陕西 0 1.44 3.16 662435. 3 480009. 8 12312. 28 58975, 38 
601908 京 运通 ”电气 设备 北京 11.26 19.93 19.95 1518373 367535.7 830927.4 289949,5 
300040 九 洲 电气 电气 设备 黑龙 江 26. 24 2.35 3.43 383770. 3 193841.6 140037. 8 79762. 31 
300304 云 意 电气 “汽车 配件 江苏 25.67 8.46 8.72 216902 143668. 5 49021. 78 39300. 51 
5-5 用 Tushare 库 获 取 的 上 市 公司 信息 
从 官网 上 ， 可 以 看 到 该 方法 返回 所 有 字段 的 如 下 描述 : 


code 表示 代码 ，name 表示 名 称 ，industry 表示 所 属 行业 ，area 表示 地 区 ，pe 表示 市 熏 率 ， 
outstanding 表示 流通 股本 ， 单 位 是 亿 ，totals 表示 总 股本 ， 单 位 是 亿 ，totalAssets 表示 总 资产 ， 单 位 
是 万 , liquidAssets 表示 流动 资产 , fixedAssets 表示 固定 资产 , reserved 表示 公积金 , reservedPerShare 
表示 每 股 公 积 金 ，esp 表示 每 股 收益 ，bvps 表示 每 股 净 资产 ，pb 表示 市 净 率 ，timeToMarket 表示 上 
市 日 期 ，undp 表示 未 分 利润 ，perundp 表示 每 股 未 分 配 利润 ，rev 表示 收入 同比 〈%) ，profit 表示 
利润 同比 〈%) ，gpr 表 示 毛 利率 〈%) ，npr 表示 净利 润 率 〈%) ，holders 表示 股东 人 数 。 

在 上 述 范例 程序 中 ， 获 取 了 所 有 的 上 述 公司 的 信息 ， 在 不 少 应 用 场景 中 ， 则 需要 根据 股票 代 
码 去 抓 取 数据 , 所 以 需要 对 上 述 范例 程序 进行 修改 , 在 下 面 的 printStockCodeByTS.py 范例 程序 中 ， 
通过 调用 Tushare 库 中 的 方法 打印 出 所 有 上 市 股票 的 代码 。 

# coding=utf-8 
import tushare as ts 
stockList=ts.get_stock basics() 


for code in stockList.index: 
print (code) 


在 第 3 行 通 过 调用 ts.get_stock_basics() 获 取 所 有 的 上 市 公司 信息 后 ， 第 4 行 用 for 循环 遍历 
stockList.index， 也 就 是 股票 代码 ， 第 5 行 则 打印 出 全 部 的 股票 代码 ， 读 者 也 可 以 参照 前 一 个 范例 
程序 把 这 些 数据 保存 到 csv 文件 中 。 


心 wN 


5.5.3 ”通过 Tushare 库 获取 某 时 间 段 内 的 股票 数据 


通过 调用 Tushare 库 中 的 get_hist_data 方法 , 可 以 得 到 指定 股票 在 指定 时 间 范 围 内 的 交易 数据 ， 
在 下 面 的 saveStockToCsvByTS.py 范例 程序 中 ， 调 用 get_hist_data 方法 来 获取 并 保存 指定 股票 在 指 
定时 间 范 围 内 的 交易 数据 。 


import tushare as ts 
def saveStockByTS (code) : “## 定义 获取 并 保存 指定 股票 交易 数据 的 方法 
start='2019-01-01' 
end='2019-01-31" 
ts.get hist datal(code=code,start=start,end=end) .to csv('d: 
\\stockData\\ch5\\' +codet+'.csv',columns=['open', 'high','close','low', 
"volume']) 
6 ”<# 开始 调用 
7 ”code='600895'  # 股票 “张江 高 科 ” 


wo 心 wN 


82 | ”基于 股票 大 数据 分 析 的 Python 入 门 实战 ( 视频 教学 版 ) 


8 saveStockByTS (code) 

9 ”# 也 可 以 去 掉 下 面 的 注释 ， 在 获取 股票 代码 的 同时 获取 该 股票 的 信息 
10 # stockList=ts.get stock basics () 

11 # for code in stockList.index: 

12 # saveStockByTS (code) 


在 第 2 行 的 saveStockByTs 方 法 中 ,通过 调用 第 5 行 的 get_hist_data 方法 获取 股票 的 交易 数据 ， 
该 方法 的 参数 分 别 表示 股票 代码 ， 开 始 和 结束 时 间 。 在 获取 交易 数据 之 后 ， 调 用 了 to_csv 方法 ， 
通过 指定 文件 名 和 要 保存 的 字段 列表 来 保存 获取 到 的 交易 数据 。 

在 第 8 行 中 通过 调用 saveStockByTs 方法 ， 获 取 并 保存 了 股票 “张江 高 科 ” 在 2019 年 1 月 份 
的 交易 数据 。 同 时 ， 可 以 采用 printStockCodeByTS.py 范例 程序 中 的 用 法 ， 如 第 10 行 到 第 12 行 所 
示 ， 在 获取 股票 代码 的 同时 就 获取 该 股票 的 所 有 基本 信息 。 


5.6 ”本章 小 结 


由 于 本 书 的 目的 是 通过 股票 相关 的 范例 程序 来 学 习 Python， 因 此 在 本 章 的 前 面 内 容 ， 给 出 了 
股票 的 基本 常识 以 及 需要 用 到 的 相关 Python 库 ; 之 后 通过 各 种 库 ， 示 范 了 如 何 实现 获取 并 保存 股 
票数 据 的 功能 。 一 方面 , 读者 可 以 通过 股票 相关 的 范例 程序 来 学 习 聆 虫 和 正则 表达 式 等 相关 知识 的 
使 用 技巧 ; 另 一 方面 ， 读 者 可 以 掌握 获取 股票 相关 数据 的 方法 ， 这 是 后 续 章 节 编写 股票 范例 程序 的 
基础 。 

由 于 在 一 些 第 三 方 库 里 已 经 封装 了 获取 股票 数据 的 相关 方法 ， 因 此 在 本 章 的 最 后 还 讲述 了 通 
过 这 些 库 获 取 并 保存 股票 数据 的 用 法 。 学 习 完 本 章 , 读者 不 仅 能 了 解 到 股票 的 相关 知识 ,还 能 掌握 
多 种 获取 股票 数据 的 手段 ， 这 为 后 续 章节 的 学 习 打下 了 坚实 的 基础 。 


第 章 
通过 Matplotlib 库 绘 制 K 线 图 


在 之 前 的 章节 中 讲述 了 股票 的 基本 知识 ， 通 过 收集 股票 数据 的 范例 程序 让 大 家 了 解 了 怜 取 网 
络 数据 的 方法 。 在 本 章 中 ， 将 通过 Matplotlib 等 库 来 示范 如 何 绘制 股票 的 K 线 图 。 

本 书 的 目的 是 通过 股票 相关 的 范例 程序 向 读者 讲述 Python 知识 ， 所 以 在 讲述 K 线 图 之 前 , 会 
系统 地 讲述 各 种 Matplotlib 的 必 备 知识 ， 比 如 设置 坐标 轴 的 技巧 、 设 置 子 图 的 方式 以 及 绘制 各 类 子 
图 的 方法 。 

在 学 会 用 Python 绘制 出 K 线 图 后 ,本 章 会 通过 范例 程序 ,进一步 讲述 了 借助 各 种 K 线形 态 观 
察 股票 后 市 走势 的 相关 理论 。 


6.1 ”Matplotlib 库 的 基础 用 法 


在 Python 语言 中 ， 通 过 Matplotlib 库 只 需要 少量 代码 ， 就 能 绘制 出 诸如 条 形 图 等 图 表 。 在 本 
节 中 ， 将 讲述 Matplotlib 库 的 一 些 基础 用 法 。 


6.1.1 绘制 柱状 图 和 折线 图 


在 股票 的 各 种 指标 中 ， 人 们 看 到 最 多 的 是 柱状 图 (比如 K 线 图 和 成 交 量 ) 和 折线 图 (比如 均 
线 和 KDJ) ， 在 下 面 的 matplotlibSimpleDemo.py 范例 程序 中 就 示范 这 两 种 图 来 作为 入 门 之 始 。 


# !/usr/bin/env Python 

# coding=utf-8 

import numpy as np 

import matplotlib.pyplot as plt 
# 折线 图 

x = np.array([1,2,3,4,5]) 


MAODPp 
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Y = np.array([20,15,18,16,12]) 

8 Plt.plot (x,y,color="green",linewidth=10) 

9 “# 柱状 图 

TO RE 23a 

iT y= np array((ll416r18;12,21]) 

12 plt.bar(x,y,alpha=1,color="#ffff00',width=0.2) 
13 plt.show() 


在 这 个 范例 程序 的 第 3 行 和 第 4 行 导入 了 NumPy 和 Matplotlib 库 ， 在 第 6 行 和 第 7 行 中 定义 
了 绘制 折线 图 需要 的 数据 , 即 x 轴 和 y 轴 的 坐标 , 在 第 8 行 中 通过 调用 matplotlib.pyplot 库 中 的 plot 
方法 绘制 了 折线 图 .在 绘制 折线 图 时 ,会 把 x 和 y 数组 包含 的 坐标 点 连接 起 来 , 即 折线 会 连接 (1,20)， 
(2,15) 等 5 个 坐标 点 ， 而 且 会 根据 诸如 color="green" 等 参数 定义 折线 的 规格 ， 比 如 本 范例 程序 绘 
制 出 的 折线 是 绿色 ， 宽 度 是 10。 

在 第 10 行 和 第 11 行 设置 完 柱状 图 的 坐标 点 之 后 ， 第 12 行 则 通过 调用 matplotlib.pyplot 库 中 
的 bar 方法 绘制 柱状 图 ，bar 方法 的 前 两 个 参数 同样 是 指 坐 标点 ， 比 如 (1,14) 表示 在 坐标 点 1 的 
柱状 图 高 度 是 14，bar 方法 的 后 3 个 参数 则 指定 了 透明 度 ， 颜 色 和 宽度 等 规格 。 这 里 请 注意 ， 指 定 
颜色 时 ， 不 仅 可 以 通过 “red”“green ”等 方式 ， 而 且 还 可 以 通过 以 # 开 头 的 十 六 进 制 数 的 方式 来 指 
定 颜色 。 

最 终 需 要 像 第 13 行 那样 用 show 方法 展示 出 整个 图 形 ， 本 范例 程序 的 运行 结果 如 图 6-1 所 示 ， 
需要 说 明 的 是 ， 虽 然 本 范例 程序 绘制 出 的 图 形 是 有 颜色 的 ,但 本 书 采 用 黑白 两 色 出 版 ， 所 以 在 图 中 
未 必 能 看 到 彩色 的 效果 ， 不 过 读者 可 以 在 自己 的 计算 机 上 运行 本 范例 程序 ， 以 查看 颜色 的 效果 。 
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图 6-1 范例 程序 matplotlibSimpleDemo.py 运行 的 结果 


从 这 个 范例 程序 可 知 ， 在 调用 matplotlib.pyplot 的 plot 和 bar 方法 绘制 折线 图 和 柱状 图 时 ， 可 
以 通过 参数 名 = 参数 值 的 方式 来 指定 折线 的 规则 ， 本 范例 中 是 设置 了 颜色 和 宽度 等 属性 ， 在 后 续 章 
节 中 ， 还 将 通过 更 多 范例 程序 讲述 其 他 常用 参数 的 用 法 。 
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6.1.2 ”设置 坐标 轴 刻 度 和 标签 信息 


在 6.1.1 小 节 的 范例 程序 中 ， x 和 yy 轴 的 刻度 文字 是 数字 ， 而 在 绘制 股票 等 信息 的 图 表 时 ， 就 
有 可 能 是 日 期 或 其 他 字符 串 ， 并 且 在 某 些 应 用 中 ， 有 可 能 还 要 动态 设置 坐标 轴 取 值 的 上 下 限 范围 。 
对 于 这 类 的 需求 ， 在 matplotlibAxisDemo.py 范例 程序 中 演示 了 设置 坐标 轴 信 息 的 常见 用 法 。 
1 # !/usr/bin/env Python 

# coding=utf-8 

import numpy as np 


已 

3 

4 import matplotlib.pyplot as plt 
5 ”# 折线 图 
6 
1 
8 


x = np.array([1,2,3,4,5]) 
Y = np.array([20,15,18,16,25]) 
Plt.xticks(x, ('20190101"',"'20190105","'20190110",'20190115',"'20190120'), 
color='blue') 
9 plt.yticks (np.arange (10,30,2),rotation=30) 
10 plt.ylim(10,30) 
11 plt.xlabel ("Date") 
12 plt.ylabel ("Price") 
13 plt.plot(x,y,color="red",linewidth=1) 
14 plt.show!() 


在 第 6 行 和 第 7 行 中 设置 了 连接 折线 的 5 个 坐标 点 的 x 和 y 轴 的 值 。 

在 第 8 行 中 通过 调用 xticks 方法 设置 了 x 轴 的 刻度 信息 .这 里 调用 该 方法 时 , 传 入 了 三 个 参数 : 
第 一 个 参数 表示 坐标 轴 的 位 置 ， 具 体 是 第 6 行 定义 的 x 数组， 第 二 个 参数 表示 要 显示 的 刻度 内 容 ， 
由 于 在 这 个 范例 中 x 轴 上 有 5 个 值 ， 因 此 这 5 个 值 分 别 和 第 二 个 参数 中 的 5 个 日 期 相对 应 ， 比 如 
'20190101' 则 对 应 于 原来 刻度 为 1 的 位 置 ; 第 三 个 参数 表示 x 轴 的 刻度 信息 用 蓝 色 显 示 。 

在 第 9 行 中 通过 调用 yticks 方法 设置 了 y 轴 的 刻度 信息 ， 这 里 调用 了 arange 方法 ， 表 示 y 轴 
的 刻度 是 从 10 开始 到 30， 步 长 是 2 的 等 差 数列 ， 而 且 还 通过 rotation 属性 设置 了 y 轴 标 签 文字 的 
旋转 角度 。 

在 第 10 行 中 通过 调用 ylim 方法 设置 了 y 轴 刻 度 的 下 限 和 上 限 ， 这 里 分 别 是 10 和 30。 在 第 11 
行 和 第 12 行 中 ， 分 别 调用 xlable 和 ylabel 方法 设置 了 x 和 y 轴 的 主题 标签 。 

在 第 13 行 中 通过 调用 plot 方法 , 根据 上 述 信息 绘制 了 一 条 宽度 是 1 的 红色 折线 , 最 后 在 第 14 
行 通过 调用 show 方法 完成 了 绘制 操作 。 运 行 这 个 范例 程序 ， 就 能 看 到 如 图 6-2 所 示 的 结果 ， 注 意 
其 中 坐标 轴 的 显示 效果 。 
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6-2 ”设置 坐标 轴 刻 度 和 标签 信息 的 范例 程序 之 运行 结果 


6.1.3 ”增加 图 例 和 图 表 标 题 


为 了 让 图 表 更 易于 理解 ， 往 往 会 添加 图 例 和 标题 ， 一 般 来 说 是 调用 title 方法 设置 标题 ， 调 用 
legend 方法 设置 图 例 。 在 matplotlibTitleDemo.py 范例 程序 中 将 演示 如 何 增加 图 例 和 标题 。 


# !/usr/bin/env python 

# coding=utf-8 

import numpy as np 

import matplotlib.pyplot as plt 
x=np.arange (-2,3) 

Plt.xlim(-2,2) 

Plt.plot (x, 2*x, color="red", label='y=2x') 
Plt.plot (x, 3*x,color="blue", label='y=3x') 
9 plt.legend(loc='2') 

10 # plt.legend(loc='upper left' ) 和 第 9 行 等 价 
11 plt.title("Func Demo",fontsize='large',fontweight='bold',]loc ='center') 
12 plt.show!() 


在 第 6 行 中 设置 了 x 轴 的 取 值 上 下 限 ,在 第 7 和 第 8 行 中 分 别 调用 plot 方 法 绘制 了 y=2x 和 y=3x 
这 两 个 函数 的 图 形 ， 请 注意 ， 通 过 plot 方法 的 第 三 个 参数 ， 设 置 了 这 两 个 折线 的 label (标签 ) 值 ， 
而 在 第 9 行 调用 legend 设置 图 例 时 ， 则 是 显示 这 里 设置 的 标签 信息 。 

第 9 行 调 用 legend 方法 时 ， 传 入 了 一 个 参数 loc=2， 该 参数 表示 图 例 的 显示 位 置 ， 也 可 以 像 第 
10 行 那样 ， 通 过 字符 串 的 方式 指定 显示 位 置 ， 它 们 两 者 是 等 价 的 ， 相 关 参 数 含义 如 表 6-1 所 示 。 


表 6-1 loc 参数 值 及 其 含义 的 一 览 表 


vawm 必 wm 


数值 参数 值 字符 串 参数 值 图 例 位 置 
0 best 最 适合 的 位 置 
1 Upper right 右上 角 

| 2 Upper left 左上 角 


| 3 lower left 左下 角 
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( 续 表 ) 

| 数值 参数 值 字符 串 参数 值 图 例 位 置 
| 4 lower right 右 下 角 

5 right 右 侧 

7 center right 右 侧 中 间 

8 lower center 下 侧 中 间 
| 9 upper center 上 侧 中 间 
| 10 center 中 间 


在 第 11 行 中 通过 调用 title 方法 设置 了 图 表 的 标题 ， 其 中 第 一 个 参数 表示 标题 的 文字 ， 后 面 的 
参数 则 表示 设置 标题 的 字体 等 属性 。 
在 范例 程序 的 最 后 ， 即 第 12 行 ， 调 用 show 方法 绘制 了 图 表 ， 结 果 如 图 6-3 所 示 。 


Func Demo 


图 6-3 含 图 例 和 标题 图 表 


6.2 Matplotlib 图 形 库 的 常用 技巧 


在 6.1 节 ， 通 过 绘制 柱状 图 和 折线 图 的 范例 程序 ， 读 者 应 该 了 解 了 Matplotlib 库 的 基本 用 法 ， 
在 本 节 中 ， 将 进一步 讲述 Matplotlib 库 的 其 他 常见 用 法 ， 包 括 如 何在 图 形 中 显示 中 文 ， 以 及 坐标 轴 
相关 的 高 级 实用 技能 。 


6.2.1 绘制 含 中 文字 符 的 饼 图 


通过 饼 图 可 以 直观 地 展示 统计 数据 中 每 一 项 在 总 数 中 的 占 比 , 在 Matplotlib 库 中 ,可 以 通过 调 
用 pyplot.pie 方法 来 绘制 饼 图 。 
比如 ， 在 一 个 月 中 ， 某 家 庭 的 各 项 收益 是 工资 23000， 股 票 2000， 基 金 2000， 著 书 收益 1500， 
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视频 教程 收益 2000， 其 他 收益 800。 在 下 面 的 matplotlibPieDemo.py 范例 程序 中 将 示范 如 何 绘制 各 
项 收入 的 占 比 。 


# !/usr/bin/env Python 

# coding=utf-8 

import matplotlib.pyplot as plt 

# 显示 中 文字 符 

plt.rcParams['font.sans-serif']=['"'SimHei'] 

labels = [' 工 资 '，' 股 票 "，' 基 金 '，' 著 书 收益 '，' 视频 教程 收益 "，' 其 他 '] 
sizes = [23000,2000,2000,1500,2000,800] 

explode = (0,0.1,0.1,0.1,0.1,0.1) 

9 colors=['red','blue','green','#ffff00"',"#ff00ff',"'#f£0£000'] 
10 plt.pie(sizes,explode=explode,labels=labels, startangle=45,colors=colors) 
11 plt.title(" 本 月 收入 情况 ") 

12 plt.show() 


通过 第 5 行 的 配置 就 能 在 绘制 的 图 形 中 显示 中 文 ， 在 第 6 行 和 第 7 行 中 以 列表 的 形式 定义 了 
各 项 收入 的 名 称 及 其 数据 。 在 第 10 行 中 通过 调用 pie 方法 绘制 了 基于 各 项 收入 的 饼 图 。 该 方法 的 
常用 参数 如 表 6-2 所 示 ， 而 在 第 11 行 通过 调用 title 方法 指定 了 饼 图 的 标题 。 


表 6-2 pie 方法 中 常用 参数 一 览 表 


参数 含义 
|lzbel | 访 疾 馆 图 的 说 明文 和 | 
Jsizs | 每 1 统 Hw 娄 | 
[aas | 半径 ,对 EL | 


半径 ， 默 认 是 


OAINMAODNP 


每 块 饼 图 的 颜色 
起 始 角度 ， 默 认 图 是 从 x 轴 正 方向 逆 时 针 画 起 ， 这 里 设置 是 
45， 表 示 从 x 轴 逆 时 针 方 向 45 度 开 始 画 起 


运行 这 个 范例 程序 ， 就 能 看 到 如 图 6-4 所 示 的 饼 图 。 


本 月 收入 情况 


startangle 


视频 教程 收益 


等 书 收益 
基金 


6-4 ， 饼 图 的 效果 图 
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6.2.2 ”柱状 图 和 直方 图 的 区 别 


柱状 图 和 直方 图 从 形状 上 看 很 相似 ， 但 在 统计 学 中 ， 它 们 表示 的 含义 却 不 相同 。 

人 们 一 般 通 过 柱状 图 (Bar) 来 展示 统计 数据 的 个 数 ， 比 如 ， 有 一 组 某 周 星期 一 到 星期 五 股票 
上 涨 的 个 数 的 数据 ， 就 可 以 通过 柱状 图 的 形式 展示 出 来 。 下 面 的 drawBar.py 范例 程序 演示 了 这 个 
效果 。 
# !/usr/bin/env Python 
# coding=utf-8 
import matplotlib.pyplot as plt 


day = ['Monday','Tuesday', 'Wednesday','Thursday', 'Friday'] 
increase number = [100,150,180,80,130] 
plt.bar(range (len (day)), increase number, width=0.8,bottom=None, 
color='red',tick label=day) 
8 # plt.bar(range (len (day)), increase number,width=0.8, 
color='red',tick label=day) 
9 plt.rcParams['font.sans-serif']=['SimHei'] 
10 plt.xlabel(' 日 期 ') 
11 plt.ylabel(' 股 票 上 涨 个 数 ') 
12 plt.title(' 股 价 上 涨 个 数 的 柱状 图 ') 
13 plt.show() 
在 第 5 行 和 第 6 行 中 分 别 定义 了 周一 到 周 五 股票 上 涨 的 个 数 ， 在 第 7 行 中 通过 调用 plt.bar 方 
法 绘制 出 柱状 图 ， 该 方法 的 原型 如 下 : 
matplotlib.pyplot.bar (left, height, width=0.8, bottom=None, hold=None, 
**kwargs) 


下 面 来 解释 一 下 这 个 方法 其 中 常用 参数 的 含义 :left 表示 每 个 柱子 的 x 轴 左 边界 ， 在 范例 程序 
中 为 range(len(day))，len(day) 表 示 显 示 数 据 的 个 数 ， 为 5 个 ，range 表示 每 个 柱子 展示 的 左边 界 分 
别 是 从 0 到 4 的 整数 ，height 表示 柱子 的 高 度 ， 在 范例 程序 中 是 increase_number， 表 示 星 期 x 上 涨 
股票 的 个 数 ; width 表示 每 个 柱子 的 宽度 ， 这 里 取 值 是 0.8; bottom 表示 每 个 柱子 的 y 轴 下 边界 ， 
这 里 取 值 为 None， 表 示 用 默认 的 值 ， 即 下 边界 取 值 是 0， 最 后 **kwargs 参数 表示 绘制 该 柱状 图 的 
样式 ， 这 里 的 值 是 color='red',tick_label=day， 表示 柱状 图 的 填充 色 是 红色 ,x 轴 坐 标的 刻度 是 天 数 。 

通过 第 9 行 的 程序 代码 的 设置 ， 以 允许 在 绘制 该 柱状 图 时 显示 中 文 ， 通 过 第 10 行 到 第 12 行 
的 程序 代码 分 别 设置 了 x 轴 和 y 轴 的 标签 以 及 图 表 的 标题 ， 最 后 是 通过 第 13 行 的 程序 代码 绘制 出 
该 柱状 图 ， 结 果 如 图 6-5 所 示 。 


王 
加 
3 
4 
5 
6 
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股价 上 涨 个 数 的 柱状 图 


125 


股票 上 涨 个 数 
a 


Wednesday Thursday 
日 期 


6-5 ”drawBar.py 范例 程序 绘制 出 的 柱状 图 


直方 图 (Histogram) 是 由 一 组 高 度 不 等 的 纵向 线段 表示 数据 分 布 的 情况 ， 在 直方 图 中 ， 一 般 
是 用 x 轴 表 示 数 据 类 型 ，y 轴 表 示 数 据 的 分 布 情况 。 比 如 用 直方 图 可 以 统计 在 某 些 价格 区 间 范 围 内 
股票 的 数量 。 在 下 面 的 drawHist.py 范例 程序 中 将 示范 如 何 绘制 直方 图 。 


# !/usr/bin/env python 

# coding=utf-8 

import matplotlib.pyplot as plt 

import numpy as np 

tockprico = TION 21O Te 20 0 SO T7720] 
group = [10, 20, 30, 40] 

plt.hist(stockPrice, group, histtype='bar', rwidth=0.8) 
Plt.xticks (np.arange (0,50,10)) 

9 plt.yticks(np.arange (0,5,1)) 

10 plt.rcParams['font.sans-serif']=['SimHei'] 

11 plt.xlabel(' 股 价 分 组 ') 

12 plt.ylabel(' 个 数 ') 

13 ”plt.title(' 统 计 股价 分 组 的 直方 图 ' ) 

14 plt.show!() 


在 第 5 行 中 给 出 了 若干 个 股票 的 价格 ， 在 第 6 行 中 给 出 了 价格 的 分 组 ， 在 第 7 行 中 通过 调用 


o vawm 必 wm 


plt.hist 方法 来 绘制 直方 图 ， 表 6-3 给 出 了 常用 参数 的 说 明 。 
表 6-3 hist 方法 中 常用 参数 一 览 表 
参数 含义 本 范例 程序 中 的 取 值 
n 指定 每 个 箱子 分 布 的 数据 ， 对 应 x 轴 | stockPrice， 表 示 股 票 价格 
. ey group， 表 示 价 格 在 10 到 20，20 到 30，30 
bins 指定 对 应 的 柱状 图 的 个 数 到 40 范围 内 的 股票 个 数 
histtype 直方 图 的 形状 取 值 是 bar， 表 示 是 以 柱状 图 的 样式 绘制 
rwidth 宽度 0.8 
color 颜色 本 例 中 没有 设置 这 个 值 
*+*kwargs ”| 相关 式样 的 参数 本 例 中 没有 设置 这 个 值 
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在 第 8 行 和 第 9 行 中 设置 了 x 轴 和 y 轴 的 刻度 ， 在 第 10 行 中 指定 了 本 图 中 允许 使 用 中 文 ， 在 
从 第 11 行 到 第 13 行 的 程序 代码 中 指定 了 x 轴 和 y 轴 的 标签 以 及 图 形 的 标题 ， 最 后 的 第 15 行程 序 
代码 绘制 出 了 直方 图 。 

这 个 范例 程序 中 的 运行 结果 如 图 6-6 所 示 ， 从 中 可 以 看 到 在 指定 区 间 内 《比如 价格 从 10 元 到 
20 元 ) 股票 的 个 数 。 


统计 股价 分 组 的 直方 图 


0 10 20 30 
股价 分 组 


图 6-6 drawHistpy 范例 程序 绘制 的 直方 图 


6.2.3 ”Figure 对 象 与 绘制 子 图 


在 Matplotlib 库 中 ，Figure 对 象 就 相当 于 一 块 白板 ， 通 过 Figure 对 象 可 以 设置 白板 的 大 小 、 背 
景 颜色 、 边 界 颜色 ， 之 后 即 可 在 这 块 白板 上 绘图 。 该 对 象 的 构造 方法 如 下 所 示 : 

figure (num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, 
frameon=True) 

其 中 ，num 表示 图 形 的 编号 或 名 称 ，figsize 表示 当前 Figure 对 象 的 宽度 和 高 度 ， 请 注意 这 里 
的 单位 是 英寸 ,dpi 参数 用 来 指定 分 辨 率 ， 即 每 英寸 多 少 个 像素 ， 默 认 值 是 80， facecolor 用 来 指定 
背景 颜色 ; edgecolor 表示 边框 颜色 ; frameon 用 于 设置 是 否 显示 边框 ， 默 认 值 为 True， 表 示 绘 制 边 
框 。 

既然 Figure 对 象 可 以 用 来 承载 图 像 ， 所 以 可 以 通过 该 对 象 同 时 绘制 多 个 子 图 ， 在 下 面 
matplotlibFigureDemo.py 范例 程序 中 ， 首 先 将 示范 figure 对 象 的 常见 用 法 ， 其 次 将 演示 基本 的 绘制 
子 图 的 方式 。 
1 # !/usr/bin/env Python 
2 # coding=utf-8 
区 import matplotlib.pyplot as plt 
4 import numpy as np 
5 ”# 定义 数据 
6 x= np.array([1,2,3,4,5]) 
i # 第 一 个 figure 
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8 Plt.figure (num=1, figsize=(3, 3),facecolor='yellow') 
9 plsplot(ar EAX 

10 # 第 二 个 figure 

11 plt.figure (num=2, figsize=(4, 4),edgecolor='red') 

2 lb DLO(Ey x 

13 plt.show() 

在 该 范例 程序 的 第 8 行 和 第 11 行 中 ,分别 通过 调用 plt.figure 方法 创建 了 两 块 白板 , 在 这 两 个 
方法 中 ， 分 别 通 过 参数 指定 了 图 形 的 编号 、 大 小 、 背 景 颜色 和 边框 颜色 等 属性 。 在 这 两 块 白板 上 ， 
分 别 在 第 9 行 和 第 12 行 调用 plot 方 法 ， 绘 制 了 两 个 折线 图 。 

这 个 范例 程序 的 运行 结果 如 图 6-7 所 示 ， 由 于 Figurel 的 大 小 是 3*3，Figure2 是 4*4， 因 此 能 
看 到 这 两 个 子 图 大 小 不 等 ， 而 且 为 Figurel 设置 了 黄色 的 背景 色 ， 读 者 在 自己 的 计算 机 上 运行 这 个 
范例 程序 就 可 以 看 到 这 一 效果 。 


回 rok py 
回 arkFronBook py 
B rorie py 
BD awkrest.py 


图 6-7 使 用 Figure 对 象 的 绘制 图 形 


从 运行 结果 可 知 , 这 两 个 图 形 是 分 开 显示 的 , 此 外 还 可 以 通过 figure 对 象 的 add_subplot 方法 ， 
在 一 个 图 形 里 绘制 多 个 子 图 。 

add_subplot 方法 的 基本 样式 是 add_subplot(221)， 表 示 子 图 将 以 2*2 的 形式 排列 ， 即 在 一 块 白 
板 上 可 以 绘制 4 个 子 图 ， 最 后 一 位 1 则 表示 ， 当 前 子 图 绘制 在 4 个 子 图 的 第 一 个 位 置 。 在 下 面 的 
matplotlibAddSubplotDemo.py 范例 程序 中 将 示范 如 何 通 过 该 方法 绘制 子 图 。 


# !/usr/bin/env python 

# coding=utf-8 

import numpy as np 

import matplotlib.pyplot as plt 
x = np.arange (0, 10) 

# 新 建 figure 对 象 
fig=plt.figure() 

# 子 图 1 

axl=fig.add subplot (3,3,1) 

axl .Blot(xr x) 


Powanowmw 必 wm 


oo 
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# 子 图 2 

ax3=fig.add subplot (3,3,5) 
ax3.plot (x, x * x) 

# 子 图 4 

ax4=fig.add subplot (3,3,9) 
ax4.plot (x, 1/x) 
Plt.show() 


在 第 7 行 中 创建 了 一 个 figure 对 象 ， 在 第 9 行 、 第 12 行 和 第 15 行 中 通过 调用 add_subplot 方 


法 分 别 创建 了 3 个 子 图 ， 从 参数 中 可 知 ， 这 三 个 子 图 分 别 位 于 3*3 位 置 中 的 第 1、 第 5 和 第 9 个 位 
置 ， 而 通过 第 10 行 、 第 13 行 和 第 16 行 的 代码 指定 了 在 三 个 子 图 中 绘制 的 函数 图 形 。 在 图 6-8 中 


可 以 看 到 这 3 个 子 图 的 效果 。 
5 > 
y 0 5 
50 
0 
0 5 10 
0.5 (人 
2.5 :30 75 
作 | 《| 了 | 中 |Q| 三 


图 6-8 调用 add_subplot 方法 绘制 的 子 图 


6.2.4 调用 subplot 方法 绘制 子 图 


在 6.2.3 小 节 的 范例 程序 中 ， 是 通过 调用 Figure 对 象 的 add_subplot 方法 来 绘制 子 图 ， 此 外 ， 


还 可 以 调用 pyplot. Subplot 方法 在 一 块 白板 里 绘制 多 个 子 图 。 


前 一 节 的 范例 程序 中 , 各 子 图 的 大 小 是 一 致 的 , 在 下 面 的 matplotlibSubplotsDemo.py 范例 程序 


中 将 示范 如 何 绘制 不 同 大 小 的 子 图 。 


o vaum 必 wm 


# !/usr/bin/env Python 

# coding=utf-8 

import numpy as np 

import matplotlib.pyplot as plt 

x = np.arange(0, 5) 

plt.figure() # 设置 白板 

plt.subplot (2,1,1) # 第 一 个 子 图 在 2*1 的 第 1 个 位 置 
Plt.plot (x, x*x) 
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9 plt.subplot (2,2,3) # 第 二 个 子 图 在 2*2 的 第 3 个 位 置 
TOPIC LA 

11 plt.subplot (224) # 第 三 个 子 图 在 2*2 的 第 4 个 位 置 
T2 PILEOPlOER7 二 XXX 

13 Plt.show() 

在 第 7 行 、 第 9 行 和 第 11 行 中 通过 调用 subplot 方法 分 别 指定 了 3 个 子 图 的 位 置 。 其 中 第 一 
个 子 图 位 于 2*1 样式 的 上 方 , 而 第 二 和 第 三 个 子 图 位 于 2*2 样式 中 的 左下 方 和 右 下 方 , 同时 , 在 第 
8 行 、 第 10 行 和 第 12 行 中 指定 了 三 个 子 图 中 所 绘制 的 函数 。 

请 注意 ， 调 用 subplot 方法 的 主体 是 pyplot 对 象 ， 而 不 是 Figure 对 象 ， 这 个 范例 程序 的 运行 结 
果 如 图 6-9 所 示 。 


图 6-9 调用 add_subplot 方法 绘制 的 子 图 


6.2.5 ”通过 Axes 设置 数字 型 的 坐标 轴 刻 度 和 标签 


Axes 的 中 文 含义 是 “轴线 ”， 放 在 Matplotlib 的 上 下 文中 ， 可 以 理解 成 由 “坐标 轴 ” 构 成 的 
子 区 域 。 

在 实际 的 应 用 中 ， 通 过 Axes 对 象 不 仅 可 以 绘制 子 图 ， 还 可 以 设置 坐标 轴 的 信息 。 在 之 前 的 范 
例 程序 中 是 通过 调用 pyplot 中 的 xticks 等 方法 设置 坐标 轴 ， 通 过 Axes 对 象 ， 可 以 更 灵活 地 设置 坐 
标 轴 的 刻度 和 标签 。 

先 来 看 看 下 面 的 matplotlibAxisMoreDemo.py 范例 程序 ， 该 范例 程序 示范 了 Axes 对 象 设置 坐 
标 轴 的 基本 用 法 。 
# !/usr/bin/env python 
# coding=utf-8 
import numpy as np 
import matplotlib.pyplot as plt 
from matplotlib.ticker import MultipleLocator, FormatSstrFormatter 


AoArnOGODOp 


xmajorLocator = MultipleLocator (5) # 将 x 轴 主 刻度 设置 为 5 的 倍数 
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xmajorFormatter = FormatStrFormatter('%$1.1f') # 设置 x 轴 标签 的 格式 
xminorLocator = MultipleLocator(1) # 将 zx 轴 次 刻度 设置 为 1 的 倍数 
ymajorLocator = MultipleLocator(0.5)  # 将 y 轴 主 刻度 设置 为 0.5 的 倍数 
ymajorFormatter = FormatStrFormatter('%1.2f') # 设置 y 轴 标签 的 格式 
yminorLocator = MultipleLocator(0.1)  # 将 y 轴 次 刻度 设置 为 0.1 的 倍数 


x = np.arange(0, 21, 0.1) 

ax = plt.subplot (111) 

# 设置 主 刻度 标签 的 位 置 ， 标 签 文本 的 格式 
ax.xaxis.set major locator (xmajorLocator) 
ax.xaxis.set major formatter (xmajorFormatter) 
ax.yaxis.set major locator (ymajorLocator) 
ax.yaxis.set major formatter (ymajorFormatter) 


# 显示 次 刻度 标签 的 位 置 ， 没 有 标签 文本 

ax.xaxis.set minor locator (xminorLocator) 
ax.yaxis.set minor locator (yminorLocator) 
Y = np.sin(x)  # 绘图 图 形 为 y=sinx 
Plt.plot (x,y) 

Plt.show() 


在 这 个 范例 程序 中 的 第 15 行 ， 通 过 调用 subplot 方法 设置 了 当前 画布 上 只 有 1 个 子 图 ， 通 过 


第 14 行 调 用 的 方法 设置 了 x 轴 的 取 值 ， 即 从 0 开始 到 21， 步 长 为 0.1。 


在 第 25 行 中 设置 了 将 要 绘制 的 函数 是 y=sinx, 第 26 行 和 第 27 行 的 程序 代码 绘制 出 了 如 图 6-10 


所 示 的 图 形 。 


1.00 


0.0 5.0 10.0 15.0 20.0 
6-10 “坐标 轴 刻 度 是 数字 的 范例 
通过 图 6-10， 再 结合 代码 ， 可 以 看 到 本 代码 中 设置 坐标 轴 标 签 和 刻度 的 相关 方法 ， 和 6.1.2 小 


节 的 范例 程序 相 比 ， 本 节 的 这 个 范例 程序 的 代码 能 更 灵活 地 设置 坐标 轴 信 息 。 


(1) 第 7 行 到 第 9 行 的 程序 代码 设置 了 x 轴 的 主 刻度 是 5 的 倍数 ， 次 刻度 是 1 的 倍数 ， 而 刻 


度 标签 的 显示 格式 是 1.1f， 即 带 一 位 小 数位 。 
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(2) 第 10 行 到 第 12 行 的 程序 代码 设置 了 y 轴 的 主 刻度 、 次 刻度 和 标签 的 格式 ， 相 关 设 置 从 
图 6-10 中 的 刻度 值 10.10 也 能 得 到 验证 。 

(3) 在 第 17 行 中 通过 调用 ax.xaxis.set_ major_locator(xmajorLocator) 方 法 ， 指 定 了 ax 对 象 的 
主 刻 度 是 第 7 行 定 义 的 描述 x 主 刻度 的 xmajorLocator 对 象 , 同样 ,第 23 行 通过 调用 set_minor_ locator 
方法 ， 指 定 了 ax 的 次 刻度 是 xminorLocator 对 象 〈 次 刻度 是 1 的 倍数 ) 。 在 第 18 行 中 ， 通 过 调用 
set_major formatter 方法 ， 指 定 了 x 轴 刻 度 的 格式 是 xmajorFormatter， 即 带 1 位 小 数 的 格式 。 

(4) 在 第 19 行 、 第 20 行 和 第 24 行 ， 调 用 了 和 (3) 相同 的 方法 ， 设 置 了 y 轴 的 主 刻 度 ， 
次 刻度 和 标签 的 格式 。 请 注意 ， 由 于 y 轴 刻 度 的 标签 格式 是 1.2f， 因 此 y 轴 上 标签 文字 带 有 2 
位 小 数 。 


6.2.6 ”通过 Axes 设置 日 期 型 的 坐标 轴 刻 度 和 标签 


在 诸如 画 K 线 图 等 的 图 表 类 型 的 应 用 中 ， 坐 标 轴 的 主 刻度 和 次 刻度 有 可 能 是 日 期 ， 在 下 面 的 
matplotlibAxisForDate.py 范例 程序 中 来 示范 一 下 相关 的 用 法 。 


# !/usr/bin/env Python 

# coding=utf-8 

from matplotlib.dates import WeekdayLocator, DayLocator, MONDAY 
import matplotlib.pyplot as plt 

import numpy as np 

import matplotlib as mpl 

import datetime as dt 


co vawm 必 wm 


9 fig = Plt.figure() 

10 ax = fig.add subplot (111) # 定义 图 的 位 置 

11 startDate = dt.datetime(2019,4,1) 

12 endDate = dt.datetime(2019,4,30) 

13 interval = dt.timedelta(days=1) 

14 dates = mpl.dates.drange (startDate, endDate, interval) 


15 y= np.random.rand(len(dates))*10 # 产生 若干 个 随机 数 
16 ax.plot date(dates, y, linestyle='-.') # 设置 时 间 序 列 
17 # ax.plot date(dates, y, linestyle='-.') # 可 以 查看 这 个 样式 


18 dateFmt = mpl.dates.DateFormatter('%Y-%m-%d') # 时 间 的 显示 格式 
19 ”# 设置 主 刻度 和 次 刻度 的 时 间 

20 mondays = WeekdayLocator (MONDAY) 

21 alldays = DayLocator () 

22 ax.xaxis.set major formatter (dateFmt) 

23 ax.xaxis.set major locator (mondays) 

24 ax.xaxis.set minor locator (alldays) 

25 fig.autofmt_xdate() # 自 动 旋转 

26 plt.show() 


在 第 3 行 引 入 了 matplotlib.date 中 与 时 间 相关 的 开发 包 〈 即 库 ) 。 在 第 11 行 和 第 12 行 中 设置 
了 坐标 轴 的 开始 和 结束 时 间 ， 通 过 第 13 行 和 第 14 行 的 程序 代码 设置 了 坐标 轴 中 时 间 的 递 进 序列 ， 
即 按 天 的 单位 递 进 。 

如 果 x 轴 和 y 轴 都 是 数字 ， 那 么 可 以 通过 (x,y) 的 形式 绘制 点 ， 对 于 时 间 等 类 型 的 坐标 轴 ， 则 
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需要 像 第 16 行 那样 ， 调 用 plot_date(dates, y, linestyle='-.") 方 法 绘制 连 线 ， 其 中 第 一 个 参数 表示 x 轴 
的 时 间 值 ， 第 二 个 参数 表示 y 轴 的 值 ， 第 三 个 参数 表示 线 的 格式 。 在 运行 这 个 范例 程序 时 ， 读 者 可 
以 对 比 一 下 第 16 行 和 第 17 行 运行 的 结果 。 

在 第 18 行 中 定义 了 时 间 的 显示 格式 ， 在 第 20 行 到 第 24 行 中 定义 了 x 轴 的 主 刻度 是 时 间 范 围 
内 每 周一 的 日 期 ， 次 刻度 是 每 天 的 日 期 ， 而 显示 的 时 间 格 式 为 “年 -月 -日 ”。 

为 了 避免 显示 的 时 间 内 容 相 互 重 厂 ， 于 是 编写 了 第 25 行 的 程序 代码 ， 旋 转 了 x 轴 上 的 时 间 ， 
最 后 执行 第 26 行 的 程序 代码 绘制 整体 图 形 。 

在 图 6-11 中 ， 可 以 看 到 主 刻度 ， 比 如 4 月 1 日， 是 周一 ， 而 两 个 主 刻度 之 间 有 6 个 次 刻度 ， 


分 别 代表 两 个 周一 之 间 的 六 天 。 
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图 6-11 ”坐标 轴 刻 度 是 日 期 的 范例 


6.3 绘制 股市 K 线 图 


前 面 讲述 了 Matplotlib 库 中 与 图 形 相关 的 知识 ， 在 本 节 将 通过 绘制 K 线 图 的 范例 程序 ， 以 综 
合 实践 的 方式 加 深 对 Matplotlib 知识 的 运用 。 


6.3.1 上 线 图 的 组 成 要 素 


K 线 是 由 开盘 价 、 收 盘 价 、 最 高 价 和 最 低 价 这 四 个 要 素 构 成 。 
在 得 到 上 述 四 个 值 之 后 ， 首 先 用 开盘 价 和 收盘 价 绘制 成 一 个 长 方形 实体 。 随 后 根据 最 高 价 和 
最 低 价 ， 把 它们 垂直 地 同 长 方形 实体 连 成 一 条 直线 ， 这 条 直线 就 叫 影 线 。 如 果 再 细 分 一 下 ， 长 方形 


实体 上 方 的 就 叫 上 影 线 ， 下 方 的 就 叫 下 影 线 。 
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在 实际 的 股票 交易 中 ， 如 果 收 盘 价 比 开盘 价 高 ， 则 为 上 涨 ， 就 把 长 方形 实体 绘制 成 红色 ， 这 
样 的 KK 线 叫 阳线 。 反 之 为 下 跌 ， 则 把 长 方形 实体 绘制 成 绿色 ， 这 样 的 K 线 就 叫 阴线 。 

通过 K 线 可 以 形象 地 记录 价格 变动 的 情况 ， 常 用 的 有 日 K 线 , 周 K 线 和 月 K 线 。 其中, 周 K 
线 是 指 以 周一 的 开盘 价 ， 周 五 的 收盘 价 ， 全 周 最 高 价 和 全 周 最 低 价 这 四 个 要 素 组 成 的 K 线 。 同 理 
可 以 推 知 出 月 K 线 的 定义 。 


6.3.2 ”通过 直方 图 和 直线 绘制 K 线 图 


从 6.3.1 小 节 可 知 , K 线 图 其 实 是 由 长 方形 〈( 即 矩形 ) 和 直线 组 成 , 在 下 面 的 drawKWithBar.py 
范例 程序 中 ， 通 过 Python 中 的 直方 图 和 直线 这 两 大 要 素来 绘制 K 线 图 。 


生 # !/usr/bin/env python 

2 # coding=utf-8 

a import matplotlib.pyplot as plt 

4 def drawK (open,close,high,1low,pos): 

5 if close > open: # 收盘 价 比 开 盘 价 高 ， 上 涨 
6 myColor='red' 

myHeight=close-open 

8 myBottom=open 

9 else: # 下 跌 

10 myColor='green’' 

3 myHeight=open-close 

hy myBottom=close 

Pe # 根据 开盘 价 和 收盘 价 绘制 长 方形 实体 

14 P1Lt.bar (Pos，height=myHeight,bottom=myBottom，width=0.2,color=myColor) 
| # 根据 最 高 价 和 最 低 价 绘制 上 下 影 线 

16 P1lt.vlines (Pos，high，1low，myColor) 


17 才 定义 时 间 范 围 
18 day = ['20190422','20190423','20190424','20190425','20190426','20190429', 
'20190430'] 

19 drawK(10.2,10.5,9.5,11,0) # 0422 交易 情况 
20 drawK(10.5,10,10.6,9.8,1) # 0423 交易 情况 
21 drawK(10,10.7,10.9,9.9,2) # 0424 交易 情况 
22 drawK(10.7,10.1,10.9,9.9,3) # 0425 交易 情况 
23 drawK(10.1,10.2,10.5,9.5,4) # 0426 交易 情况 
24 drawK(10.2,10.8,10.8,10.1,5) “ # 0429 交易 情况 
25 drawK(10.8,11.5,10.8,11.1,6)  # 0430 交易 情况 


27 plt.ylim(0,15) # 设置 y 轴 的 取 值 范围 

28 plt.xticks (range (len (day)),day) # 设置 x 轴 的 标签 
29 plt.rcParams['font.sans-serif']=["'SimHei'] 

30 plt.title('xx 股票 K 线 图 (20190422 到 20190430)') 
31 plt.show!() 


从 第 4 行 到 第 16 行 的 程序 语句 定义 了 名 为 drawK 的 方法 来 绘制 每 天 的 K 线 图 。 从 第 5 行 到 
第 12 行 的 让..else 语句 中 ， 根 据 开 盘 价 和 收盘 价 来 判断 当日 是 上 涨 还 是 下 跌 ， 并 据 此 设置 了 绘制 
直方 图 的 各 种 参数 ， 如 果 上 涨 ，K 线 的 颜色 为 红色 ， 反 之 则 为 绿色 。 
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在 drawK 方法 程序 区 块 内 的 第 14 行 中 , 通过 调用 bar 方法 绘制 了 K 线 中 的 实体 长 方形 , 请 注 
意 它 的 底部 是 开盘 价 或 收盘 价 的 最 小 值 ,高 度 则 是 开盘 价 和 收盘 价 两 者 之 差 , 颜色 为 红色 或 为 绿色 。 
在 第 16 行 中 通过 调用 vlines 方法 连接 当日 的 最 高 价 和 最 低 价 ，vlines 方法 其 实 就 是 画 出 上 下 影 线 。 

定义 好 drawK 方法 之 后 ， 在 第 18 行 中 定义 了 要 绘制 K 线 的 日 期 ， 并 在 第 19 行 到 第 25 行 中 ， 
通过 传 入 开盘 价 等 参数 ， 调 用 drawK 方法 绘制 了 从 20190422 到 20190430 这 几 天 的 K 线 图 。 

在 第 27 行 中 ， 通 过 调用 ylim 方法 设置 了 y 轴 的 取 值 范围 。 在 第 28 行 中 ， 通 过 调用 xticks 设 
置 了 x 轴 的 标签 。 在 第 29 行 中 设置 了 支持 中 文 的 显示 。 在 第 30 行 中 设置 了 包含 中 文 的 图 形 标 题 ， 
最 后 通过 第 31 行 的 show 方法 绘制 了 图 形 ， 这 个 范例 程序 的 执行 结果 如 图 6-12 所 示 。 


xx 股票 K 线 图 (20190422 到 20190430) 


0 - 
20190422 20190423 20190424 20190425 20190426 20190429 20190430 


图 6-12 使 用 直方 图 和 直线 绘制 出 的 K 线 图 


6.3.3 ”通过 mpl_finance 库 绘制 K 线 图 


在 6.3.2 小 节 的 范例 程序 中 ， 绘 制 出 了 K 线 图 的 大 致 效果 。 此 外 ，mpl_ finance 库 中 的 
candlestick2_ochl 方法 也 可 用 于 实现 类 似 的 功能 。 该 方法 不 仅 能 接受 一 组 数据 并 批量 地 绘制 出 一 组 
K 线 图 ， 还 支持 从 指定 文件 中 读 取 股市 的 相关 数据 ， 它 的 原型 如 下 。 


candlestick2_ochl (ax,opens,closes,highs,1lows,width=4,colorup='red', 
colordown='green',alpha=0.75) 


其 中 ，ax 表示 要 绘制 K 线 图 的 Axes 对 象 ，opens,closes,highs,lows 分 别 代 表 一 组 开盘 价 ， 收 盘 
价 ， 最 高 价 和 最 低 价 ，width 表示 K 线 图 的 宽度 ，colorup 和 colordown 分 别 代表 涨 或 跌 时 K 线 图 
长 方形 实体 中 填充 的 颜色 ， 而 alpha 表示 透明 度 。 在 下 面 的 drawK.py 范例 程序 中 将 演示 调用 这 个 
方法 的 具体 用 法 。 
1 # !/usr/bin/env python 
# coding=utf-8 
import pandas as pd 
import matplotlib.pyplot as plt 
from mpl finance import candlestick2 ochl 
# 从 文件 中 获取 数据 
df = pd.read csv('D:/stockData/ch6/600895.csv',encoding='gbk',index col=0) 


auwmwwN 
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# 设置 图 的 位 置 
fig = plt.figure() 
ax = fig.add subplot (111) 
# 调用 方法 绘制 K 线 图 

candlestick2_ochl (ax = ax, opens=df["Open"] .values, closes=df["Close"] .values, 
highs=df["High"] .values, lows=df["Low"] .values, width=0.75, colorup='red', 
colordown='green') 
# 设置 x 轴 的 标签 
Plt.xticks (range (len (df.index.values)),df.index.values,rotation=30 ) 
ax.grid(True) # 带 网 格 线 
plt.title ("600895 张江 高 科 的 K 线 图 ") 
plt.rcParams['font.sans-serif']=['SimHei'] 
P1Lt.show() 


在 第 7 行 从 文件 中 读 取 了 第 5 章 中 通过 仆 虫 得 到 的 csv 格式 的 股票 数据 , 该 文件 内 的 数据 格式 


如 图 6-13 所 示 。 该 csv 文件 中 的 第 1 行 描述 了 数据 的 标题 ， 后 面 的 若干 行 则 是 每 天 的 股票 交易 数 
据 。 


jpate ,high,Low,0pen,close,uolume ,ndj Close 
2919-81-82,16.329999923786955 ,14.719899838146973 ,15 .06899984196167 ,15.939998395175781,75979984,15.939906385175781 
:2819-91- 83 ,16 .6499996185369273,15.319999n196167,15.779999732971191,16.239999771118164,94733382,16 .239999771118164 
2819- 91-Bn,16.579999923706955,15-699999381469727,15.69999989926513 


16.299999237868547 ,68985635,16 -299999237969547 
8915527344,59222671,16 -299999915527344 
5527344 ,55522382 ,16 .8949888915527344 
829998857763672,52641127 ,16 -929898457763672 
14448918,15.199999889265137 ,53282898,15.199999889265137 
265137 ,15 .5688884196167 ,42857493 ,15.5688084196167 
6293945 ,15.84699998381846973 ,43255147 ,15 .469808038146973 
73,15.539999961853827 ,31687291,15.539999961853927 
-91-16,16 .179999676293985,15 .468 16938146973 ,44711686 ,15 .719999638146973 

-91-17 ,17 .849999237868547 ,15 .680909381469727 ,15 .690098381469727 ,16.979999542236328 ,86309543 ,16 .979999542236328 
12819- 91-18 ,16 .799999237869587 ,16 .049999237868547 ,16.719999313354492,16.299900915527344,62198832,16 .290808915527344 
12019-01-21,16.530888686645588,15.920886976293945 ,16.219999313354492 ,16.399999618538273 ,38675827 ,16 .399999618538273 
12819-81-22,16.98999984741211,16.219999313354492 ,16 .299999237868547 ,16.368888618351562 ,47887722 ,16 .369080619351562 
| 2819- 91-23 ,16.689998369517578 ,15.99999988781211,16.369999619351562,16.399999618539273 ,49198374,16.399999618539273 
2819- 91-28,16 .649999618538273,15.939999395175781,16 -649999618538273,16 . 96999969482422 ,39457212 ,16 .86999969482422 
2819- 61-25 ,16 .9849009915527344,15 .270888457763672 ,15 .928988976293945 ,15.329999923786855 ,42175769 ,15 .329999923786855 
12819- 61-28 ,15.569999694824219 ,15.219999638146973,15-5,15.359998381469727,21769886,15-359999381469727 
-91-29,15.5,14-189990395175781， 989957763672,14.539999961853927,314691261,14-539999961853927 
-91-30,14.770008457763672,14.329999923786855 ,14.489999771118164,14.369999885559882 ,16274136,14.369999885559882 
-91-31,14.75,13.579999923786855 ,14.6899995883833 ,13 00190734863 ,32695437 ,13， 


-01-88 ,16.559999465942383 ,15 818 
-81-89 ,16 .329999923796955,15-75， 


-91-15,15 .649998343322754,15 .99 0 


6-13 包含 股票 数据 的 csv 文件 
在 上 述 范例 程序 的 第 12 行 中 , 通过 调用 candlestick2_ochl 方 法 绘制 了 K 线 图 ,其 中 以 dff"Open"] 


等 的 方式 从 csv 文件 中 读 取 数 据 并 作为 参数 传 入 。 


在 第 14 行 把 x 轴 的 标签 文字 设置 为 csv 文件 中 的 "Date" 字段 。 第 15 行 的 程序 代码 设置 了 网 


格 线 ， 最 后 在 第 18 行 调用 plt.show 方法 绘制 出 整个 图 形 。 


这 个 范例 程序 的 运行 结果 如 图 6-14 所 


从 中 可 以 看 到 ， 调 用 candlestick2_ochl 方法 绘制 K 


线 图 不 仅 简便 而 且 效果 好 。 
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图 6-14 调用 mpl_finance 库 中 的 candlestick2_ochl 方法 绘制 的 K 线 图 


6.4 上线 对 未 来 行情 的 预 判 


K 线 是 股市 中 应 用 最 为 广泛 的 技术 指标 ， 前 面 讲 述 了 使 用 Python 语言 绘制 K 线 的 技巧 ， 本 节 
将 讲述 股票 理论 中 如 何 通过 K 线 来 预 判 未 来 的 行情 。 


6.4.1 不 带 上 下 影 线 的 长 阳线 


不 带 上 下 影 线 的 长 阳线 也 叫 光头 光 脚 长 阳线 ， 这 表示 在 当日 的 交易 中 ， 股 票 的 最 高 价 和 收盘 
价 相 同 ， 最 低 价 和 开盘 价 相同 ， 长 方形 的 实体 较 大 ， 如 图 6-15 所 示 。 


图 6-15 光头 光 脚 长 阳线 


这 说 明 多 方 ( 买 方 ) 强劲 ， 空 方 卖方) 无力 招 架 ， 这 种 形态 经 常 出 现在 回调 结束 后 的 上 涨 
或 高 位 拉 升 阶段 ， 有 时 候 ， 在 严重 超 跌 后 的 反弹 中 也 能 看 到 此 类 形态 。 

从 图 6-16 中 ,可 以 看 到 在 2019 年 1 月 ， 航 天 通信 (600677) 出 现 了 多 个 此 类 的 大 阳线 ， 在 出 
现 此 类 形态 的 后 市 ， 该 股票 继续 上 涨 的 概率 大 一 些 。 
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图 6-16 股票 “航天 通信 ”在 2019 年 1 月 的 K 线 走势 图 


6.4.2 ”不 带 上 下 影 线 的 长 阴线 


与 光头 光 脚 长 阳线 对 应 的 是 不 带 上 下 影 线 的 长 阴线 形态 。 在 这 种 形态 里 ， 股 票 的 最 高 价 和 开 
盘 价 相同 ， 最 低 价 和 收盘 价 相同 ， 长 方形 的 实体 较 大 ， 如 图 6-17 所 示 。 此 类 K 线 表示 卖方 〈 空 方 ) 
占 绝对 优势 ， 买 方 〈 多 方 ) 无 力 还 手 。 此 类 形态 经 常 出 现在 高 位 开始 下 跌 的 初期 以 及 反弹 结束 后 的 
下 跌 走势 中 。 


图 6-17 不 带 上 下 影 线 的 长 阴线 


比如 , 金 花 股份 (600080) 于 2019 年 4 月 出 现 了 上 述 不 带 上 下 影 线 的 长 阴线 的 形态 , 在 后 市 ， 
该 股 继续 下 跌 的 概率 大 一 些 ， 如 图 6-18 所 示 。 


图 6-18 股票 “ 金 花 股份 ” 在 2019 年 4 月 的 K 线 走势 图 
6.4.3 ”预测 上 涨 的 早晨 之 星 


除了 分 析 单 日 的 K 线 之 外 ， 还 可 以 通过 分 析 多 日 的 K 线形 态 来 预测 后 市 的 走向 ， 比 如 图 6-19 
给 出 的 早晨 之 星 的 形态 。 
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早晨 之 星 
图 6-19 K 线 的 早晨 之 星 形态 


早晨 之 星 一 般 出 现在 明显 的 下 跌 趋势 中 ， 通 常 由 三 根 连续 的 K 线 组 成 ， 它 一 般 是 个 底部 反 转 
信号 。 其 中 ， 第 1 天 的 K 线 是 一 根 实 体 较 长 的 阴线 ， 第 2 天 是 一 根 带 上 下 影 线 的 小 阳线 或 十 字 星 ， 
第 3 天 是 一 根 大 阳线 ， 第 3 天 的 收盘 价 一 般 要 超过 第 2 天 的 最 高 价 ， 且 要 超过 第 1 天 K 线 实体 的 
一 半 以 上 。 在 这 种 形态 中 , 第 3 天 的 K 线 实体 越 长 ,， 并且 收盘 价 相 对 于 第 1 天 的 K 线 的 位 置 越 高 ， 
则 后 市 反弹 的 可 能 性 就 越 大 ， 反 弹 的 强度 也 就 越 大 。 

参考 图 6-20， 在 康 欣 新 材 (600076) 2019 年 3 月 和 4 月 的 K 线 形态 中 ， 其 最 左边 的 部 分 ， 可 
以 看 到 由 3 根 K 线 组 成 的 早晨 之 星 的 形态 ， 在 之 后 的 交易 日 ， 该 股票 出 现 了 一 波 上 涨 。 


图 6-20 ”股票 “ 康 欣 新 材 ” 在 2019 年 3 月 和 4 月 的 K 线 走势 图 


6.4.4 ”预测 下 跌 的 黄昏 之 星 
和 早晨 之 星相 对 应 ， 黄 昏 之 星 是 一 个 预测 项 部 反 转 的 信号 ， 如 图 6-21 所 示 。 


] 


黄昏 之 星 
图 6-21 黄昏 之 星 的 K 线形 态 
它 一 般 出 现在 上 升 趋势 中 ， 通 常 也 是 由 三 根 连续 的 K 线 组 成 。 第 1 天 线 为 一 根 实体 较 长 的 
阳线 , 第 2 天 则 是 一 根 带 上 下 影 线 的 小 阴线 或 十 字 星 ， 第 3 天 是 一 根 大 阴线 , 第 3 天 的 收盘 价 一 定 
要 超过 第 2 天 K 线 的 最 低 价 ， 同 时 要 超过 第 1 天 K 线 实体 的 一 半 以 上 。 在 这 种 形态 中 ， 一 般 第 3 
天 K 线 的 实体 越 长 且 收 盘 价 相对 于 第 1 天 K 线 的 位 置 越 低 ， 则 下 跌 的 可 能 性 就 越 大 ， 下 跌 的 幅度 
也 就 越 大 。 
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6.4.5 ”预测 上 涨 的 两 阳 夹 一 阴 形 态 


该 形态 是 由 三 根 K 线 组 成 ， 一 般 会 出 现在 股价 的 上 升 
天 下 跌 收 阴线 ， 第 3 天 再 度 上 扬 收 阳线 ， 如 图 6-22 所 示 。 


中 


两 阳 夹 一 


mm 


阴 


通道 中 。 第 1 天 股价 上 涨 收 阳线 ， 第 2 


图 6-22 两 阳 夹 一 阴 的 形态 


一 般 如 果 出 现 这 种 形态 ， 则 说 明 买 方 (多方) 力量 强劲 ， 短 期 该 股 有 可 能 上 涨 。 其 中 , 第 2 
天 阴线 底部 ( 即 第 2 天 的 最 低 价 ) 越 高 ,实体 越 短 (开盘 价 和 收盘 价 之 间 的 差距 越 小 ) ， 则 后 市 上 


涨 的 可 能 性 就 越 大 。 


参考 图 6-23， 在 皖 维 高 新 (600063) 2019 年 2 月 和 3 月 的 K 线 走势 图 中 ,最 左边 的 3 根 K 线 


组 成 了 两 阳 夹 一 阴 的 形态 ， 从 后 市 看 出 ， 出 现 该 形态 后 ， 


该 股 走出 了 一 波 上 扬 的 行情 。 


图 6-23 股票 “ 皖 维 高 新 ”在 2019 年 2 月 和 3 月 的 K 线 走势 图 


6.4.6 ”预测 下 跌 的 两 阴 夹 一 阳 形 态 


这 种 K 线 的 形态 一 般 出 现在 股价 的 下 行 通道 中 。 其 中 第 1 天 的 股价 下 跌 收 阴线 ， 第 2 天 股价 
上 升 收 阳线 ， 第 3 天 再 度 下 跌 收 阴线 ，K 线 图 如 图 6-24 所 示 。 


两 阴 夹 一 


阳 


图 6-24 两 阴 夹 一 阳 的 形态 
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如 果 出 现 这 种 形态 ， 则 说 明 当 前 股价 呈 下 降 趋 势 ， 其 中 ， 第 2 天 阳线 的 顶部 越 低 ， 实 体 越 短 ， 
则 下 跌 的 可 能 性 就 越 大 ， 下 跌 的 幅度 也 可 能 就 越 大 。 

参考 图 6-25， 在 浙江 广 厦 (600052) 2019 年 4 月 的 K 线 走势 图 中 ， 从 最 左边 的 3 根 K 线 中 ， 
可 以 看 到 两 阴 夹 一 阳 的 形态 ， 出 现 该 形态 后 ， 该 股 走出 了 一 波 下 跌 的 行情 。 


图 6-25 股票 “浙江 广 厦 ” 在 2019 年 4 月 的 K 线 走势 图 
> 
6.5 ”本章 小 结 


本 章 分 为 三 个 部 分 ， 在 第 一 部 分 中 讲述 了 绘制 K 线 图 的 基本 知识 ，Matplotlib 库 的 基本 用 法 ， 
通过 Matplotlib 库 绘制 各 种 图 形 的 技巧 以 及 设置 各 种 坐标 轴 的 方式 。 在 此 基础 上 ， 本 章 第 二 部 分 示 
范 了 用 两 种 方式 绘制 出 K 线 图 。 在 本 章 的 最 后 部 分 ， 讲 述 了 通过 K 线 图 分 析 股 票 后 市 走势 的 常规 
理论 。 

通过 本 章 给 出 的 各 个 K 线 图 的 范例 程序 , 相信 读者 不 仅 能 形象 地 了 解 图 形 可 视 化 库 Matplotlib 
的 常见 用 法 ， 还 能 够 掌握 基本 的 股市 分 析 技 巧 。 


绘制 均线 与 成 交 量 


在 第 6 章 中 讲述 了 通过 Matplotlib 库 绘制 K 线 图 。 不 过 ， 在 常规 股市 分 析 中 ， 一 般 会 结合 K 
线 图 、 均 线 图 和 成 交 量 综合 评判 ， 所 以 在 本 章 中 将 继续 通过 Matplotlib 库 绘 制 出 均线 图 和 成 交 量 这 
两 类 股票 指标 。 

本 章 通过 均线 和 成 交 量 相关 的 范例 程序 ， 将 进一步 地 综合 使 用 NumPy、Pandas 和 Matplotlib 
等 库 ， 将 用 DataFrame 对 象 存储 从 csv 等 文件 中 读 取 的 数据 ， 再 调用 Matplotlib 坐标 轴 、 直 方 图 和 
折线 图 等 方法 绘制 相关 的 指标 。 

在 本 章 中 ， 还 将 综合 性 地 使 用 “异常 处 理 ”、 数 据 计 算 和 方法 的 定义 和 调用 等 知识 ， 根 据 股 
票 买卖 的 理论 ,计算 相关 的 买卖 点 。 在 这 个 过 程 中 ,读者 不 仅 能 掌握 与 股票 相关 的 知识 ， 还 能 进 一 
步 掌握 相关 知识 在 实际 Python 项 目 中 的 使 用 技巧 。 


7.1 NumPy 库 的 常见 用 法 


NumPy (Numerical Python) 是 Python 的 一 个 扩展 程序 库 ， 它 支持 多 维 数组 与 矩阵 运算 ， 而 且 
该 库 还 内 置 了 很 多 经 优化 处 理 的 科学 计算 函数 。 


7.1.1 range 与 arange 方法 比较 


在 前 面 章 节 中 的 范例 程序 中 ， 在 生成 坐标 轴 数 据 序列 时 用 到 过 range 方法 ， 和 它 相 似 的 还 有 
arange 方法 。 在 实际 的 程序 项 目 中 ， 经 常 调用 这 两 个 方法 来 创建 数字 序列 。 

range(start, end，step) 方 法 是 Python 语言 自 带 的 ， 在 创建 的 数字 序列 时 ， 该 方法 的 三 个 参数 其 
含义 依次 为 : start 表示 数字 序列 的 起 始 值 ，end 表示 数字 序列 的 终止 值 ( 但 数字 序列 中 不 含 终止 值 
本 身 ) ，step 为 数字 序列 的 步 长 。 这 个 方法 只 能 创建 整数 类 型 的 数字 序列 ， 不 能 创建 浮 点 类 型 的 数 
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字 序 列 。 在 下 面 的 RangeDemo.py 范例 程序 中 示范 了 range 方法 的 一 些 用 法 。 


oAMAODNPp 


# !/usr/bin/env python 

# coding=utf-8 

# 输出 0 到 4 的 整数 ， 但 不 包含 5 

for val in range(0,5): 

# 等 价 for val in range(0,5,1): 
Print (val) 

# 输出 0, 2,4 

for val in range(0,5,2): 
Print (val) 

# 如 下 代码 会 出 错 ， 因 为 range 不 支持 浮 点 类 型 

for val in range(0,5,0.5): 
print (val) 


在 第 4 行 中 调用 range(0,5) 创 建 了 0 到 4 的 整数 序列 ， 请 注意 创建 的 序列 中 不 包含 5， 在 第 8 


行 中 通过 第 3 个 参数 设置 了 步 长 为 2， 所 以 第 8 行 和 第 9 行 的 循环 ， 输 出 的 数字 序列 是 0,2,4。 


由 于 range 方法 只 支持 整数 类 型 ， 而 不 支持 浮 点 类 型 ， 因 此 如 果 编 写 第 11 行 的 程序 代码 将 步 


长 设置 为 0.5， 程 序 执行 时 就 会 抛 出 异常 。 


NumpPy 库 里 的 arange 方法 和 range 用 法 很 相似 ， 但 前 者 可 以 生成 浮 点 类 型 的 数据 ， 且 该 方法 


返回 的 是 numpy.ndarray 类 型 的 数组 数据 ,在 ArangeDemo.py 范例 程序 中 示范 了 arange 方法 的 相关 
用 法 。 


1 
2 
3 
4 
5 
6 


# !/usr/bin/env python 

# coding=utf-8 

import numpy as np 

print (np.arange (0,1,0.1)) 

for val in np.arange(1,3,0.5) : 
Print (val) 


第 4 行 的 输出 结果 是 [0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]， 结 果 中 依然 不 包含 由 第 2 个 参数 指 


定 的 终止 值 1， 同 时 可 以 看 到 np.arange 方法 支持 浮 点 类 型 的 数据 。np.arange 方法 同样 支持 迭代 ， 
执行 第 5 行 和 第 6 行 的 for 循环 ， 输 出 的 结果 是 1.0，1.5，2.0 和 2.5。 


7.1.2 ndarray 的 常见 用 法 


如 7.1.1 小 节 所 述 ,numpy.arange 方法 返回 的 是 numpy.ndarray 类 型 的 数组 ,而 ndarray 是 NumPy 


库 里 存储 一 维 或 多 维 数组 的 对 象 。 下 面 的 ndarray.py 范例 程序 示范 了 该 对 象 的 常见 用 法 。 


OCODOPp 


# !/usr/bin/env python 
# coding=utf-8 
import numpy as np 


arrl = np.arange (0,1,0.2) 

# 输出 [0. 0.2 0.4 0.6 0.8] 
Print (arrl) 

# 输出 <class 'numpy.ndarray'> 
Print (type (arrl) ) 
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10 print(arrl.ndim) # 返回 arrl 的 维度 ， 是 1 
11 # 输 出 [1 2 3 4] 

12 print(np.array (range(1,5))) 

13 arr2=np.array([[1,2,3],[4,5,6]]) # 二 维 数 组 


14 print(arr2.ndim) # 返回 2 
15 print(arr2.size) # 总 长 度 ， 返 回 6 
16 Print (arr2.dtype) # 类 型 ， 返 回 int32 


17 # 形状 ， 返 回 (2，3) ， 表 示 二 维 数组 ， 每 个 维度 长 度 是 3 
18 Print (arr2.shape) 
19 arr3=np.array([1,3,5]) 
20 print(arr3.mean()) # 计算 平均 数 ， 返 回 3 
21 print(arr3.sum()) # 计算 和 ， 返 回 9 
22 # 计算 所 有 行 的 平均 数 ， 返 回 [2. 5.] 
23 Print (arr2.mean(axis=1)) 
24 ## 计算 所 有 列 的 平均 数 ， 返 回 [2.5 3.5 4.5] 
25 Print (arr2.mean(axis=0)) 
第 4 行 的 程序 代码 通过 调用 np.arange(0,1,0.2) 方 法 定义 了 一 个 起 始 值 是 0、 终 止 值 是 1 (不 包 
含 1) 、 步 长 为 0.2 的 ndarray 类 型 的 数组 。 执 行 第 7 行 的 print 语句 ， 可 以 看 到 该 对 象 中 的 值 ， 执 
行 第 9 行 的 打印 语句 ， 就 能 确认 调用 np.arange 方法 生成 的 是 numpy.ndarray 类 型 的 数据 。 
ndarray 包含 了 4 个 比较 常见 的 属性 。 


(1) 是 ndim 属性 ， 如 第 10 行 和 第 14 行 所 示 ， 它 返回 该 ndarray 的 维度 ， 比 如 在 第 14 行 中 ， 
二 维 数组 的 ndim 属性 是 2。 

(2) 是 size 属性 ， 表 示 总 长 度 ， 如 第 15 行 返回 的 arr2 的 总 长 度 是 6。 

(3) 是 dtype 属性 ， 表 示 类 型 ， 如 第 16 行 返回 的 是 inB2， 表 示 arr2 中 存储 的 数据 类 型 是 int32。 

(4) 是 shape 属性 ， 表 示 形 状 ， 如 第 18 行 返回 的 是 2, 3)， 表 示 arr2 是 二 维 数组 ， 每 个 维度 
长 度 是 3。 


在 大 多 数 应 用 场景 中 ， 只 是 通过 ndarray 来 管理 一 维 数组 ， 但 是 在 有 些 应 用 场景 中 ， 需 要 用 它 
来 定义 多 维 数组 ， 如 第 13 行 所 示 ， 以 np.array([[1,2,3],[4,5,6]]) 之 类 的 方式 来 定义 多 维 数组 。 

此 外 , 还 可 以 像 第 20 行 那样 , 调用 mean() 方 法 来 计算 一 维 数组 的 平均 值 , 如 果 遇 到 多 维 数组 ， 
则 可 以 像 第 23 行 那样 ， 计 算 每 行 的 平均 值 , 或 者 像 第 25 行 那样 ， 计 算 每 列 的 平均 值 。 而 计算 元 素 
和 的 方法 可 参考 第 21 行 的 程序 语句 。 


7.1.3 ”数值 型 索引 和 布尔 型 索引 


在 7.1.2 小 节 中 提 到 用 ndarray 来 存储 一 维 或 多 维 数组 ， 如 果 要 具体 定位 到 某 个 或 某 行 元 素 ， 
那么 就 得 使 用 索引 。 关 于 ndarray 的 索引 要 注意 三 点 : 第 一 ， 索 引 值 从 0 开始， 而 不 是 从 1 开始 ; 
第 二 ， 请 尽量 避免 索引 越界 ， 第 三 ，ndarray 比较 常见 的 有 传统 索引 和 花样 索引 。 

下 面 通过 ndarrayIndex.py 范例 程序 来 看 一 下 索引 的 相关 用 法 。 
# !/usr/bin/env Python 
# coding=utf-8 


import numpy as np 
arrl = np.arange(0,1,0.2) 


ODP 
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5 # 输 出 0.4 

6 print (arrl[2]) 

7 ”# 会 报 出 “索引 越界 ”的 错误 

8 # print (arr1[6]) 

Sg arr2 = np-arravytlllir 2 3 UA Sr Gly Dr 37 O11 
10 # 返回 [4 5 6] 

11 print(arr2[1]) 

12 # 返回 6 

13 print(arr2[1,2]) 

14 arr3 = np.arange(5) 

15 bool = np.array([True,False,False,True,True]) 
16 # 输 出 [0 3 4] 

17 print(arr3[bool]) 

18 arr4=arr3[arr3>2] 

19 # 输出 [3 4] 

20 Print(arr4) 


在 第 6 行 中 通过 arrl1[2] 来 访问 arrl 的 第 3 个 元 素 ， 请 注意 索引 值 是 从 0 开始 ， 而 且 在 使 用 索 
引 值 访问 时 ， 请 尽量 避免 出 现 索引 越界 的 异常 ， 如 果 取 消 第 8 行 的 注释 ， 就 会 抛 出 越界 异常 。 

第 11 行 的 代码 通过 索引 访问 了 三 维 数组 arr2， 其 中 返回 的 是 数组 的 第 2 行 ， 即 第 二 个 一 维 数 
组 。 如 果 要 访问 数组 中 的 具体 元 素 ， 则 可 以 像 第 13 行 那样 ， 用 两 个 索引 值 来 指定 要 访问 数组 的 行 
和 列 。 

在 实际 的 程序 项 目 中 ， 用 得 较 多 的 是 数字 类 型 的 索引 ， 此 外 还 可 以 使 用 布尔 类 型 的 索引 。 在 
第 14 行 中 调用 arange 方法 生成 了 一 个 数组 arr3, 在 第 17 行 中 只 是 返回 在 bool 数组 中 值 为 True 的 
元 素 ， 即 索引 为 0，3，4 这 三 个 元 素 。 

布尔 类 型 索引 的 用 法 也 可 以 像 第 18 行 那样 ， 返 回 指定 数组 (比如 ar3〉 中 指定 条 件 ( 大 于 2) 
的 元 素 ， 执 行 第 20 行 的 输出 语句 就 能 看 到 第 18 行 布尔 索引 语句 产生 作用 的 输出 结果 。 


7.1.4 通过 切片 获取 数组 中 指定 的 元 素 


在 创建 好 数组 后 ， 可 以 通过 切片 的 方式 来 获取 指定 范围 的 数据 ， 下 面 的 ndarraySplitpy 范例 程 
序 示范 了 切片 的 相关 用 法 。 
# !/usr/bin/env Python 
# coding=utf-8 
import numpy as np 
arrl = np.arange (0,11,1) 
00 20 3 4 5 6 78 omnof 
print (arr1) 
arrSplitl = arrl[2:5] 
# 输出 [2 3 4] 
Print (arrSplit1) 
# 输出 [2 3 4 5 6 7 8 9], 不 包含 10 
print (arrl[2:-1]) # -1 表示 最 右边 的 元 素 
# 二 出 [ 2 3 4 5 6 7 8 09510] 
print (arr1[2:]) # 表示 从 2 号 索引 开始 到 最 后 ， 包 含 10 
# 输出 [0 1 2 3 4] 
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15 print (arrl[:5]) # 表示 从 0 号 索引 开始 到 5 号 索引 
16 > 输出 [120 3 405637 8 

17 print(arrl[2:-2]) # -2 表示 右边 开始 第 2 个 元 素 
18 “志和 输 出 [0 1 234567] 

19 print(arrl[:-3]) # -3 表示 右边 开始 第 3 个 元 素 


20 ”# 针对 多 维 数组 的 切片 
21 "arr2 二 mnPasray(T ra 2723]704 Sr 61]) 
22 # a 输 出 [[2 3] 
2 [5 6]] 
24 print(arr2[[0,1],1:]) 

在 第 7 行 中 能 看 到 切片 的 相关 用 法 , 即 通过 2:5 的 形式 ,表示 要 获取 数据 的 开始 和 终止 索引 位 
置 ， 从 第 9 行 的 输出 来 看 ， 取 出 的 数据 是 包含 起 始 位 置 ， 但 不 包含 终止 位 置 ， 具 体 来 讲 ，2:5 形式 
的 切片 不 包含 5 号 元 素 。 

切片 的 起 始 和 终止 索引 还 可 以 出 现 负 数 ， 比 如 在 第 11 行程 序 语句 中 的 终止 位 置 是 -1， 这 里 的 
-1 是 表示 从 右边 开始 的 第 1 个 元 素 ， 所 以 2:-1 则 表示 从 2 号 索引 开始 ， 到 右边 第 一 个 元 素 结束 ， 
不 包含 终止 元 素 , 第 10 行 的 注释 部 分 就 是 第 11 行程 序 语句 的 输出 结果 , 读者 也 可 以 自己 执行 这 条 
程序 语句 来 验证 这 个 结论 。 

也 就 是 说 ， 负 号 表示 从 右边 开始 ，-1 表示 从 右边 开始 的 第 一 个 元 素 ， 所 以 在 第 17 行 和 第 19 
行 的 输出 中 ，-2 和 -3 分 别 代 表 从 右边 开始 第 2 和 第 3 个 元 素 。 

如 果 不 出 现 起 始 位 置 或 终止 位 置 ， 比 如 第 13 行 和 第 15 行 的 程序 语句 ， 则 表示 默认 起 始 位 置 
为 0 或 默认 终止 位 置 为 最 后 一 个 元 素 。 

在 第 24 行 中 示范 了 针对 二 维 数组 切片 的 方式 ， 有 具体 而 言 ， 是 通过 逗号 分 隔 切片 规则 ，[0,1] 表 
示 数 组 第 一 行 的 切片 规则 ， 而 1: 则 表示 数组 第 二 行 的 切片 规则 。 


7.1.5 切片 与 共享 内 存 


当 以 切片 的 方式 从 ndarray 中 获得 数组 的 一 部 分 元 素 时 ， 请 千 万 注意 ， 此 时 并 没有 创建 新 的 数 
组 ,切片 和 原 数 组 是 共享 内 存 的 ， 所 以 当 改变 切片 中 元 素 的 值 时 ， 原 数组 中 对 应 元 素 的 值 也 会 跟着 
改变 。 如 果 忽 略 了 这 一 点 ， 就 有 可 能 出 现 意料 之 外 的 结果 ， 在 下 面 的 shareSplit.py 范例 程序 中 将 示 
范 切 片 与 原 数 组 共享 内 存 的 效果 。 


1 # !/usr/bin/env Python 

# coding=utf-8 

3 import numpy as np 

4 x = np.arange(0,5,1) 

5 "Y= x[2:4] 

6 y[0]=10 

7 print(y) # 输出 [10 3] 

8 print(x) # 输出 [ 0 1 10 3 4] 
9 c=x.copy() 

10 c[0]=20 

11 print(x) # 输出 依然 是 [ 0 1 10 3 4]， 没 改变 


在 第 4 行 中 定义 了 数组 x, 在 第 5 行 中 通过 x 数组 切片 的 形式 定义 了 数组 y。 在 第 6 行 的 本 意 
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是 只 修改 y 数组 , 但 通过 第 8 行 的 输出 会 发 现 x 数组 的 索引 2 对 应 的 元 素 ( 即 y 数组 的 第 0 号 索引 
对 应 的 元 素 ) 也 发 生 了 改变 ， 原 因 就 是 切片 数组 y 和 原 数组 x 共享 了 内 存 。 

因此 ， 在 这 种 情况 下 ， 开 发 人 员 会 在 不 经 意 间 错误 地 修改 了 原 数 组 ， 为 了 避免 此 类 情况 的 发 
生 ， 可 以 编写 像 第 9 行 那样 的 程序 语句 ， 通 过 调用 copy 方法 新 创建 一 个 内 容 等 同 x 的 数组 c〈 即 
复制 功能 ) 。 这 样 ， 即 使 编写 了 第 10 行 的 程序 代码 而 修改 了 e 中 元 素 的 值 ， 原 数组 x 中 元 素 的 值 
也 不 会 发 生变 化 ， 执 行 第 11 行 的 打印 语句 就 能 验证 这 一 点 。 


7.1.6 ”常用 的 科学 计算 函数 


在 NumPy 库 中 还 封装 了 一 些 常用 的 科学 计算 函数 ， 比 如 在 之 前 章节 的 范例 程序 中 ， 就 用 到 了 
求 正弦 函数 的 sin 方法 , 在 下 面 的 numpyMath.py 范例 程序 中 示范 了 NumPy 库 中 常见 科学 计算 函数 
的 用 法 。 


1 # !/usr/bin/env Python 

4 # coding=utf-8 

3 import numpy as np 

4 print(np.abs(-10)) # 求 绝 对 值 ， 该 表达 式 返 回 10 

5 print (np.around(1.2)) # 去 掉 小 数位 数 ， 该 表达 式 返 回 1 

6 print (np.round (1.7))  ## 四 舍 五 入 ， 该 表达 式 返 回 2 

7 print(np.ceil(1.1)) # 求 大 于 或 等 于 该 数 的 整数 ， 该 表达 式 返 回 2 
8 ”print (np.floor(1.1)) ”# 求 小 于 或 等 于 该 数 的 整数 ， 该 表达 式 返 回 1 
9 print(np.sqrt(16)) # 求 根 号 值 ， 该 表达 式 返 回 4 

10 print(np.square(6)) # 求 平方 ， 该 表达 式 返 回 36 


11 print(np.sign(6)) # 符号 函数 ， 如 果 大 于 0 则 返回 1， 该 表达 式 返 回 1 
12 print (np.sign(-6) ) # 符号 函数 ， 如 果 小 于 0 则 返回 -1， 该 表达 式 返回 -1 
13 print(np.sign(0)) # 符号 函数 ， 如 果 等 于 0 则 返回 0， 该 表达 式 返 回 0 
14 print(np.10g10(100)) # 求 以 10 为 底 的 对 数 ， 该 表达 式 返 回 2 

15 print(np.1og2(4) ) # 求 以 2 为 底 的 对 数 ， 该 表达 式 返 回 2 

16 Print(np.exp(1)) # 求 以 e 为 底 的 寡 次 方 ， 该 表达 式 返回 e 


17 print (np.power(2,3)) # 求 2 的 3 次 方 ， 该 表达 式 返 回 8 


在 这 个 范例 程序 中 ， 每 条 程序 语句 后 面 的 注释 都 说 明了 相关 函数 的 用 法 及 范例 表达 式 返 回 的 
值 ， 所 以 就 不 再 重复 解析 这 些 程序 语句 了 。 


7.2” ”Pandas 与 分 析 处 理 数据 


在 7.1 节 ， 已 经 通过 一 系列 范例 程序 示范 了 Pandas 库 的 使 用 ， 例 如 从 包含 股票 数据 的 csv 文 
件 中 读 取 数据 ， 而 后 绘制 出 了 线 图 。 在 本 节 中 ， 将 详细 解析 Pandas 库 中 的 数据 结构 以 及 介绍 使 
用 这 些 数 据 结构 来 读 取 文件 的 相关 技巧 。 
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7.2.1 包含 索引 的 Series 数据 结构 


Series 的 数据 结构 和 数组 很 相似 , 在 其 中 除了 能 容纳 数据 之 外 ,还 包含 了 用 于 存 取 数据 的 索引 
(Index) ， 也 就 是 说 ， 可 以 通过 索引 来 访问 Series 中 的 元 素 。 在 下 面 seriesBasic.py 范例 程序 中 示 
范 了 通过 索引 来 存 取 Series 中 元 素 的 相关 用 法 。 
# coding=utf-8 
from pandas import Series 
import pandas as pd 
sl = Series (range (3) ,index = ["one","two","three"]) 
print (s1) 输 出 如 下 
one 0 
two FE 
9 three 2 
10 dtype: int32 
11 ，， 
12 print(s1) 
3 "S82 mm (ones 1 twos 2, "threev 3}) 
14 print(s2) two 2 “one Lr threev: 3} 
15 print(s1[0]) # 输出 0 
16 print(sl['one']) # 输出 0 
17 # 抛 出 异常 ， 找 不 到 索引 print (s2['four']) 
18 arr = range(3) 
19 # 数组 转 Series 
20 s3 = pd.Series (arr) 


oawmw wm 


21 ，， 
22 print (s3) 输出 

239 0 0 

24 1 

汉王 粒 

26 dtype: int32 

27 1 

28 Print(s3) 

29 print(s3[0]) # 输出 0 


在 第 4 行 中 定义 了 Series 类 型 的 sl 对 象 ， 它 的 值 是 0 到 2， 对 应 的 索引 是 one、two 和 three。 
在 第 5 行 到 第 11 行 的 注释 中 给 出 了 第 12 行 print(s1) 的 输出 结果 ， 从 中 可 以 看 到 索引 和 数值 的 对 应 
关系 。 由 此 可 知 ，Series 索引 和 第 13 行 “ 键 - 值 对 ”的 结果 很 像 。 

在 第 15 行 和 第 16 行 中 通过 s1[0] 和 sl['one'"] 这 两 种 方式 ， 以 索引 和 索引 值 的 方式 访问 Series 
中 的 元 素 ， 这 两 种 方式 都 能 得 到 0 这 个 结果 。 

在 第 20 行 中 把 一 个 数组 转换 成 Series 对 象 ， 由 于 没 指定 索引 ， 因 此 索引 值 和 数值 是 一 致 的 ， 
由 此 可 以 通过 第 29 行 的 s3[0] 来 访问 其 中 的 元 素 。 
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7.2.2 ”通过 切片 等 方式 访问 Series 中 指定 的 元 素 


前 面 的 章节 讲述 过 通过 切片 存 取 数组 元 素 的 方法 ， 由 于 Series 也 是 数组 ， 因 此 同样 能 以 切片 


的 方式 访问 其 中 的 元 素 。 


此 外 ， 还 能 通过 调用 head，tail 和 take 等 方法 存 取 指定 的 元 素 。 在 下 面 的 seriesSplit.py 范例 程 


序 中 示范 了 各 种 存 取 Series 中 指定 元 素 的 方法 。 


oAWGDOp 


# coding=utf-8 

# Print Hello World 

from pandas import Series 

import pandas as pd 

sl = Series (range (5) ,index = ["one","two","three","four","five"]) 
1 

sl.head (2) 输出 如 下 

one 0 

七 wo 也 

dtype: int32 

print (sl.head(2)) # 如 果 不 带 参数 ， 默 认 返 回 前 5 个 
1 

s1.tail (2) 输出 如 下 

four 3 

five 4 

dtype: int32 

nr 

print (sl.tail(2))  # 如 果 不 带 参数 ， 默 认 返 回 后 5 个 
1 

sl.take([1,3]) 输出 如 下 

七 wo 中 

four 3 

dtype: int32 

1 

print(sl.take([1,3]))  # 返回 指定 位 置 的 元 素 
51 

以 切片 的 方式 访问 ， 如 下 两 句 的 输出 是 一 样 的 

七 wo 本 

three 2 

dtype: int32 

Print(sl[1:3]) 

print(sl['two':'three']) 


在 本 范例 程序 中 ， 通 过 了 多 行 注释 的 方式 给 出 了 各 打印 语句 的 输出 结果 。 在 第 7 行 的 head 方 


法 中 传 入 的 参数 是 2， 由 此 返回 sl 前 两 行 数据 。 如 果 不 传 入 参数 〈 即 不 带 参数 ) ， 则 head 方法 默 
认 返 回 前 5 条 数据 。 第 14 行 的 tail 方法 会 返回 后 2 条 数据 ， 如 果 不 带 参数 ， 则 同样 也 是 返回 后 5 
条 数据 。 在 第 26 行 是 通过 调用 take 方法 返回 指定 位 置 的 数据 ， 即 返回 指定 元 素 的 数据 。 


在 第 33 行 和 第 34 行 的 程序 代码 , 通过 指定 位 置 和 指定 索引 两 种 方式 , 打印 了 sl 的 切片 数据 ， 
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这 里 同样 请 注意 , 切片 与 原 Series 对 象 是 共享 内 存 的 ， 如 果 更 改 了 切片 对 应 元 素 的 数据 ,那么 原 对 
象 中 对 应 元 素 的 数据 也 会 跟着 改变 。 


7.2.3 创建 DataFrame 的 常见 方式 


数据 帧 (DataFrame) 是 Pandas 库 中 的 一 种 数据 结构 ， 它 用 表格 的 形式 来 存储 数据 。 该 数据 类 
型 中 包含 的 要 素 比较 多 ， 有 行 、 列 和 索引 ， 下 面 通 过 dataFrameCreate.py 范例 程序 来 示范 这 种 数据 
类 型 的 创建 方式 。 


1 # !/usr/bin/env python 

2 # coding=utf-8 

3 from pandas import DataFrame 

4 data = {'Date':['20190102','20190103','20190104'],'Open':[10,10.5,10.2], 
Close": [10.5;10.2710.3]} 

时 dfl = DataFrame (data) 

和 1 

这 Close Date Open 

8 10.5 20190102 10.0 

10.2 20190103 10.5 

10.3 20190104 10.2 


Re 
-DPpPO 


12 print(df1) 

13 df2 = DataFrame (data, columns=['Date','Open','Close']) 
14 

15 Date Open Close 

16 0 20190102 10.0 10.5 

E00 0 5 LO 

18 2 20190104 10.2 10.3 

19 0 

20 print (df2) 

21 df2 = DataFrame (data, columns=['Date','Open','Close']) 
22 print (df2) 

23 df3 = DataFrame (data, columns=['Date','Open','Close'], index=["'1','2','3']) 
24 1 

2 Date Open Close 

26 1 20190102 10.0 10.5 

27° 2 20190103 10.5 1052 

28 3 20190104 10.2 10.3 

29 0 

30 print(df3) 


通过 本 范例 程序 中 创建 DataFrame 的 方法 可 以 能 直观 地 了 解 到 该 数据 类 型 的 结构 ， 在 每 行 的 
print 语句 之 前 ， 多 行 注释 给 出 了 打印 的 结果 ， 读 者 可 以 在 自己 的 计算 机 运行 该 范例 程序 对 照 实际 
的 运行 结果 。 

在 第 5 行 中 通过 DataFrame 带 一 个 参数 的 构造 函数 创建 了 dfl 对 象 ， 通 过 第 12 行 的 打印 语句 
的 结果 可 知 ，dfl 是 以 表格 的 形式 存储 数据 。 在 每 行 数据 的 前 面 , 可 以 看 到 三 个 索引 数字 0, 1 和 2， 
但 是 这 里 显示 列 的 次 序 和 第 4 行 语句 中 data 里 的 不 一 致 ,这 是 因为 通过 了 第 13 行 的 形式 ,用 columns 
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指定 了 列 的 次 序 。 


每 行 数据 的 索引 ， 默 认 是 从 0 开始， 如 果 要 改变 索引 ， 可 以 像 第 23 行 那样 ， 在 DataFrame 构 


造 函 数 中 用 index 来 指定 每 行 的 索引 。 


7.2.4 存 取 DataFrame 对 象 中 的 各 类 数据 


DataFrame 也 提供 了 head、tail 和 take 方法 ， 用 来 返回 前 n 行 、 后 n 行 和 指定 行 的 数据 ， 用 法 
与 之 前 提 到 的 Series 很 相似 ， 就 不 再 额外 说 明了 。 

在 下 面 的 dataFrameRead.py 范例 程序 中 示范 了 其 他 存 取 DataFrame 中 数据 的 常用 方法 ， 在 范 
例 程 序 中 同样 通过 注释 语句 列 出 了 打印 的 各 种 结果 。 


# !/usr/bin/env Python 

2 # coding=utf-8 

3 from pandas import DataFrame 
4 


data = {'Date':['20190102','20190103','20190104'],'Open':[10,10.5,10.2], 


'Close':[10.5,10.2,10.3]} 


可 df = DataFrame (data, columns=['Date','Open','Close'], index=['1','2','3']) 
6 “ # 输出 Index(['1'，'2'，'3'], dtype='object') 
7 
8 


print (df.index) # 查看 索引 


# 输出 Index (['Date'，'Open', 'Close'], dtype='object') 


9 print(df.columns)  # 查看 列 名 
10 

EL D0090L0S L005 

1 P20190103W1065 T0521 

13 [P22090U040 1062 L053] 

14 

15 print(df.values) # 查看 数值 
| 


17 print(df['Open'] .values) # 查看 指定 列 的 数值 


8 vo 
19 Date 20190102 

20 Open 10 

21 Close 10.5 

22 Name: 1, dtype: object 

23 1 

24 print(df.loc['1']) # 查看 指定 索引 行 的 数值 


25 ”# 查看 指定 行 的 数值 ， 结 果 等 同 print (df . 
26 print(df.iloc[0]) 


doel To 


在 第 5 行 中 通过 传 入 数据 、 指 定 列 和 索引 的 方式 ， 创 建 了 DataFrame 类 型 的 df 对 象 。 在 第 7 


行 中 通过 dfindex 的 形式 打印 了 df 的 索引 项 。 


在 第 9 行 中 通过 了 df.columns 的 形式 打印 了 df 对 象 


中 包含 的 列 名。 在 第 15 行 中 通过 了 df values 的 形式 打印 了 df 对 象 中 的 所 有 数据 。 在 第 17 行 中 输 


出 了 df 对象 中 指定 列 Open 的 所 有 数据 。 

此 外 ,还 可 以 通过 调用 loc 和 iloc 方法 返 
返回 了 指定 索引 行 ' 中 的 数据 。 请 注意 ， 由 
是 要 加 引号 。 


回 指定 索引 行 和 指定 行 的 数据 。 在 第 24 行 中 通过 loc 
于 这 里 是 通过 索引 号 获取 数据 ， 因 此 loc 的 参数 一 般 
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在 第 26 行 中 通过 iloc 获取 指定 行 号 的 数据 , 行 号 参数 不 需要 引号 , 由 于 第 0 行 的 索引 号 是 '1'， 
因此 第 24 行 和 第 26 的 输出 结果 是 一 样 的 。 


7.2.5 通过 DataFrame 读 取 csv 文件 


从 7.2.3 小 节 和 7.2.4 小 节 可 知 ，DataFrame 是 个 存储 数据 的 容器 ， 在 实际 的 程序 项 目 中 ， 不 会 
像 7.2.4 小 节 的 范例 程序 那样 通过 程序 代码 直接 创建 并 插入 数据 ， 而 是 会 用 DataFrame 来 保存 并 处 
理 来 自 各 种 数据 源 的 表格 型 数据 。 

由 于 DataFrame 和 csv 与 excel 文件 相似 ， 都 是 以 行列 表格 的 形式 存储 数据 ， 因 此 可 以 用 来 解 
析 这 两 类 文件 。 

在 下 面 的 dataFrameReadCsv.py 范例 程序 中 ， 先 读 取 包 含 在 csv 文件 中 的 股票 价格 信息 ， 再 结 
合 之 前 学 过 的 Matplotlib 库 来 绘制 股票 的 开盘 价 和 收盘 价 的 日 期 折线 。 


1 # !/usr/bin/env python 

2 # coding=utf-8 

3 import pandas as pd 

4 import matplotlib.pyplot as plt 

5 ”# 从 文件 中 读 取 数据 

6 df = pd.read csv('D:/stockData/ch6/600895.csv',encoding='gbk', 
index_col='Date') 

7 print(df.head(1)) # 打印 第 1 行 数据 

8 print(df.tail(2)) # 打印 最 后 2 行 的 数据 

9 printl(df.index.values) # 打印 索引 列 〈Date) 数据 

10 print(df['Close'] .values)  # 打印 索引 列 (Date) 数据 

11 fig = plt.figure() 

12 ax = fig.add subplot (111) 

13 ax.grid(True) # 带 网 格 线 

14 df['open'] .plot(color="red",1abel='open') # 绘制 开盘 价 

15 df['close'].plot (color="blue",1abel='Cclose')  # 绘制 收盘 价 

16 plt.legend(loc='best') # 绘制 图 例 

17 # 设置 x 轴 的 标签 

18 plt.xticks(range(len(df.index.values)),df.index.values,rotation=30 ) 

19 plt.show!() 


在 第 6 行 中 通过 调用 Pandas 库 提供 的 read_csv 方法 读 取 600895.csv 文件 (之 前 通过 把 虫 假 取 
并 存储 的 文件 ) ， 读 取 后 的 数据 放 入 DataFrame 类 型 的 df 对 象 中 ,在 读 取 时 通过 index_col 参数 指 
定 索引 列 是 'Date'。 

在 第 7 行 中 通过 调用 head 方法 返回 了 第 1 条 数据 ， 在 第 8 行 通 过 调用 tail 方法 返回 最 后 2 条 
数据 ， 在 第 9 行 中 打印 了 index 列 ( 即 Date 列 ) 的 数据 ， 而 在 第 10 行 打印 了 收盘 价 〈Close) 这 一 
列 的 数据 。 

在 第 14 行 和 第 15 行 中 调用 df 对 象 的 plot 方法 , 根据 开盘 价 和 收盘 价 的 数据 , 绘制 两 根 折线 ， 
它们 分 别 是 红色 和 蓝 色 (本 书 采 用 黑白 印刷 看 不 到 红 蓝 颜 色 , 读者 可 以 在 自己 的 计算 机 上 运行 本 范 
例 程序 即 可 看 到 实际 的 运行 结果 ) ， 在 第 16 行 中 通过 调用 legend 方法 绘制 出 这 两 根 折线 的 图 例 。 

在 第 18 行 中 通过 参数 设置 了 x 轴 的 标签 为 Date 列 的 日 期 信息 ,为 了 不 让 显示 的 日 期 相互 重印 ， 
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通过 rotation 设置 了 文字 旋转 30 度 。 这 个 范例 程序 的 运行 效果 如 图 7-1 所 示 ， 图 例 中 的 “Open” 
和 “Close” 表 明 对 应 的 描述 开盘 价 和 收盘 价 的 折线 。 


17.0 一 Open 


一 aose 


16.5 


16.0 


15.5 


15.0 


14.5 


14.0 


SL SD OA SI 8 SO AD NY SA BT NL DA DD 人 
oSYodYo rod Yo Sod ROY OO NS 
JS TSY Eo 这 位 a TAA TTT TAT 


图 7-1 dataFrameReadCsv.py 范例 程序 读 取 csv 文件 并 绘制 股票 的 开盘 价 和 收盘 价 的 折线 图 


7.2.6 ”通过 DataFrame 读 取 Excel 文件 


同样 可 以 通过 DataFrame 对 象 读 取 Excel 文件 ， 本 节 将 用 到 第 5 章 获 取 到 的 600895.ss.xlsx 文 
件 。 和 之 前 的 csv 文件 不 同 , Excel 文件 中 Date 列 包含 的 日 期 不 是 字符 串 类 型 , 而 是 TimeStamp (时 
间 裤 ) 类型， 部 分 数据 如 图 7-2 所 示 。 


A TN WE EE Ee 


Hi Low en Close | Volune | Adj Close 
16.33 14. 71 15. 06 15.93 75979904 15.93000031 
16.65 15. 31 15.78 16. 24 94733382 16. 23999977 
16. 58 15.6 15.7 16.3 68985635 16. 29999924 
16.65 15.6 15.7 16.29 59222671 16.29000092 

2019-01-08 0:00:00 16.56 15. 81 16. 28 16. 04 55522302 16. 04000092 


7-2 待 解 析 的 Excel 文件 中 的 日 期 列 


在 dataFrameReadExcel.py 范例 程序 中 ， 将 把 时 间 戳 类 型 的 数据 转换 成 %Y-%m-%d'〈 比 如 
2019-01-02) 格式 。 


# !/usr/bin/env Python 
# coding=utf-8 
import pandas as pd 
import matplotlib.pyplot as plt 
# 从 文件 中 读 取 数据 
df = pd.read excel('D:/stockData/ch5/600895.ss.xlsx') 
for index,row in df.iterrows () : 
df.at[index, 'NewDate'] = df.at[index, 'Date'].strftime('%Y-%m-%d') 
9 fig = plt.figure() 
10 ax = fig.add subplot(111) 
11 ax.grid(True)  # 带 网 格 线 
12 df['High'] .plot (color="red",1label='High') # 绘制 最 高 价 


vawm 必 wm 
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13 df['Low'] .plot (color="blue",1label='Low') ”# 绘制 最 低 价 

14 plt.legend (loc='best') ## 绘制 图 例 

15 # 设置 x 轴 的 标签 

16 plt.xticks(range(len(df['NewDate'])),df['NewDate'] .values,rotation=30 ) 
17 plt.show() 


在 第 6 行 中 通过 调用 pd.read_excel 方 法 读 取 指定 的 Excel 文件 , 该 方法 的 返回 值 将 用 DataFrame 
类 型 的 df 对 象 接收 。 第 1 列 的 Date 数据 是 时 间 鹤 类 型 ， 通 过 第 7 行 和 第 8 行 的 for 循环 ， 在 遍历 
df 的 同时 ， 在 其 中 新 增 一 列 NewDate， 在 新 增加 的 列 中 存放 '%Y-%m-%d' 格式 的 日 期 数据 。 

该 范例 程序 中 的 其 他 代码 与 之 前 遍历 csv 文件 的 dataFrameReadCsv.py 范例 程序 很 相似 ， 在 第 
12 行 和 第 13 行 中 绘制 出 最 高 价 和 最 低 价 。 该 范例 程序 的 运行 效果 如 图 7-3 所 示 。 


17.0 一 High 
一 Low 


SN 


CE CE CE CE 
EEE OE 


图 7-3 dataFrameReadExcel.py 范例 程序 读 取 Excel 文件 并 绘制 股票 的 最 高 价 和 最 低 价 的 折线 图 


7.3 上 线 整 合 均线 


CC COE 
CRCNCNG 
TRY i De 


Va CA A A OA EAE A 
ONY ON NY OV NY ON NTN ON 
32070707 4107 07507150710 


在 实际 股票 分 析 的 应 用 中 ， 一 般 会 综合 地 观察 股票 的 K 线 、 均 线 和 成 交 量 ， 以 期 更 全 面 地 分 
析 某 只 股票 。 在 本 节 中 ， 将 在 第 6 章 讲述 K 线 图 的 基础 上 ， 再 结合 第 5 章 讲 过 的 内 容 ， 加 入 均线 
和 成 交 量 的 技术 分 析 图 ， 以 进一步 演示 Matplotlib 和 NumPy 等 库 的 用 法 。 


7.3.1 均线 的 概念 


均线 也 叫 移 动 平 均线 (Moving Average， 简 称 MA) ， 是 指 某 段 时 间 内 的 平均 股价 〈 或 指数 ) 
连 成 的 曲线 ， 通 过 这 种 均线 ， 人 们 可 以 清晰 地 看 到 股价 的 历史 波动 ， 从 而 能 进一步 预测 未 来 股价 的 
发 展 趋势 。 

均线 一 般 分 为 三 类 : 短期 、 中 期 和 长 期 。 通 常 把 5 日 和 10 日 移动 平均 线 称 为 短期 均线 ， 一 般 
供 短线 投资 者 参考 。 一 般 把 20 日 、30 日 和 60 日 移动 平均 线 作为 中 期 均线 ， 一般 供 中 线 投资 者 参 
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考 。 一 般 120 日 和 250 日 (甚至 更 长 ) 移动 平均 线 称 为 长 期 均线 ， 一 般 供 长 线 投资 者 参考 。 

在 实践 中 ， 一 般 需 要 综合 地 观察 短期 、 中 期 和 长 期 均线 ， 从 中 才能 分 析出 市 场 的 多 空 趋势 。 
比如 ， 如 果 某 股价 格 的 三 类 均线 均 上 涨 ， 且 短期 、 中 期 和 长 期 均线 是 从 上 到 下 排列 ， 则 说 明 该 股价 
格 的 趋势 向 上 ; 反之 ， 如 果 并 列 下 跌 ,， 且 长 期 、 中 期 和 短期 均线 从 上 到 下 排列 ， 则 说 明 该 股价 格 的 
趋势 向 下 。 


7.3.2 ”举例 说 明 均 线 的 计算 方法 


移动 平均 线 的 计算 公式 为 MA 二 Pl1 十 P2+P3+..…... 十 Pn) 除 以 n， 其 中 P 为 某 天 的 收盘 价 ， 
n 为 计算 周期 。 

比如 5 日 移动 平均 线 ， 就 是 把 最 近 5 个 交易 日 的 收盘 价 求 和 后 再 除 以 5， 得 到 的 就 是 当天 的 5 
日 均 价 , 再 把 每 天 的 当日 5 日 均 价 在 坐标 轴 上 连 成 线 , 就 构成 5 日 均线 。 其 他 天 数 的 移动 平均 线 可 
以 照 此 方式 计算 得 出 。 

具体 而 言 ， 从 2019 年 1 月 2 日 到 15 日 这 10 个 交易 日 里 ， 股票 “张江 高 科 ” 的 每 天 收盘 价 分 
别 是 15.93, 16.24, 16.3, 16.29, 16.04, 16.02, 15.2, 15.56, 15.46, 15.54， 在 表 7-1 中 ， 给 出 了 从 第 5 日 
到 第 10 日 每 天 的 5 日 均 价 ， 把 它们 连 起 来 ， 就 能 构成 这 些 天 的 5 日 均线 。 


表 7-1 5 日 均线 计算 一 览 表 
天 数 计算 公式 当天 5 日 均 价 
Ls | riedetSnoommeon a | ass | 


16.29+16.04+16.02+15.2+15.56 的 和 除 以 5 
16.04+16.02+15.2+15.56+15.46 的 和 除 以 5 
16.02+15.2+15.56+15.46+15.54 的 和 除 以 5 


7.3.3 ”移动 窗口 函数 rolling 


该 方法 的 原型 是 pandas.DataFrame.rolling， 常 用 参数 是 表示 数据 窗口 大 小 的 window， 调 用 这 
个 方法 ， 可 以 每 次 以 一 个 单位 移动 并 计算 指定 窗口 范围 内 的 平均 值 。 
根据 这 个 方法 的 定义 可 知 ， 用 它 能 计算 数值 序列 的 均值 ， 在 下 面 的 RollingDemo.py 范例 程序 
中 来 示范 一 下 用 法 。 
# !/usr/bin/env python 
# coding=utf-8 
import pandas as pd 
import numpy as np 
s = np.arange(1,6,1) 
print (s) # 输出 [1 2 3 4 5] 
Print (Pd.Series (5) .rolling(3) .mean()) 


auwmwwN 
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在 第 5 行 中 调用 arange 方法 生成 了 1 到 5 组 成 的 数字 序列 ， 在 第 7 行 中 指定 了 窗口 大 小 是 3， 
所 以 能 看 到 如 下 的 输出 结果 。 


必 wm P 
DL 
口 


dtype: float64 


从 第 1 行 到 第 5 行 的 输出 结果 中 可 知 ， 输 出 的 第 一 列 是 从 0 开始 的 索引 号 ， 第 二 列 是 计算 得 
出 的 平均 值 。 在 前 两 行 中 ， 由 于 数据 不 足 (数据 窗口 大 小 为 3) ， 因 此 没有 输出 ， 从 第 3 行 到 第 5 
行 的 程序 语句 中 , 可 以 看 到 每 个 数据 窗口 的 平均 值 ， 比 如 在 第 3 行 输出 的 结果 中 ,计算 平均 数 的 算 
式 是 (1+2+3) 除 以 3， 第 4 行 输出 结果 的 算式 是 (2+3+4) 除 以 3， 以 此 类 推 ， 最 后 第 6 行 输出 的 
是 数据 类 型 。 


7.3.4 用 rolling 方法 绘制 均线 


从 7.3.3 小 节 的 范例 程序 中 可 知 ，rolling 方法 是 比较 好 的 计算 均值 的 工具 ， 在 下 面 的 
drawKAndMA.py 范例 程序 中 ， 将 调用 到 这 个 方法 ， 在 第 6 章 绘制 K 线 的 drawK.py 范例 程序 的 基 
础 上 ， 引 入 3 日 、5 日 和 10 日 均线 。 


# !/usr/bin/env Python 

# coding=utf-8 

import pandas as pd 

import matplotlib.pyplot as plt 

from mpl finance import candlestick2 ochl 

# 从 文件 中 读 取 数据 

df = pd.read csv('D:/stockData/ch6/600895.csv',encoding='gbk',index col=0) 

# 设置 图 的 位 置 

9 fig = plt.figure() 

10 ax = fig.add subplot (111) 

11  # 调用 方法 绘制 K 线 图 

12 candlestick2 och]l (ax = ax,opens=df["Open"] .values, closes=df["Close"] .values, 
highs=df["High"] .values, lows=df["Low"] .values,width=0.75, colorup='red', 
colordown='green') 

13 df['Close'].rolling (window=3) .mean () .plot (color="red",1abel='3 日 均线 ') 

14 df['Close'] .rolling (window=5) .mean() .plot (color="blue",1abel='5 日 均线 ') 

15 df['Close'] .rolling (window=10) .mean() .plot (color="green",1label='10 日 均线 ') 

16 plt.legend(1loc='best') # 绘制 图 例 

17 # 设置 x 轴 的 标签 

18 plt.xticks(range(len(df.index.values)),df.index.values,rotation=30 ) 

19 ax.grid(True)  # 带 网 格 线 

20 plt.title ("600895 张江 高 科 的 K 线 图 ") 

21 plt.rcParams['font.sans-serif']=['SimHei'] 

22 plt.show() 


这 个 范例 程序 中 的 代码 和 第 6 章 的 drawK.py 范例 程序 中 的 代码 不 同 的 是 ， 从 第 13 行 到 第 15 
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行 通过 调用 rolling 方法 ， 根 据 每 天 的 收盘 价 ， 计 算 了 3 日 、5 日 和 10 日 均线 ， 并 为 每 种 均线 设置 
了 图 例 ， 在 第 16 行 中 通过 调用 legend 方法 设置 了 图 例 的 位 置 。 这 个 范例 程序 的 运行 结果 如 图 7-4 
所 示 ， 从 中 不 仅 能 看 到 指定 时 间 内 的 K 线 图 ， 还 能 看 到 3 根 均线 。 

600895 张 江 高 科 的 K 线 图 
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习 7-4 KK 线 整合 均线 的 效果 图 


7.3.5 改进 版 的 均线 图 


在 7.3.4 小 节 的 drawKAndMA.py 范例 程序 中 ， 只 演示 了 调用 rolling 方法 计算 并 绘制 均线 。 在 
本 节 的 drawKAndMAMore.py 范例 程序 中 将 做 如 下 两 点 改进 。 


(1) 为 了 更 灵活 地 得 到 股市 数据 ， 根 据 开 始 时 间 和 结束 时 间 ， 先 调用 get_data_yahoo 接口 ， 
从 雅虎 (Yahoo) 网 站 的 接口 获取 股票 数据 ， 同 时 为 了 留 一 份 数据 ， 会 把 从 网 站 中 疏 取 到 的 数据 保 
存 到 本 地 csv 文件 中 ， 而 后 再 绘制 图 形 。 

(2) 在 前 一 节 的 drawKAndMA.py 范例 程序 中 ，x 轴 的 刻度 是 每 个 交易 日 的 日 期 ， 但 如 果 显 
示 的 时 间 范 围 过 长 ， 那 么 时 间 刻 度 就 太 密集 了 ， 影 响 图 表 的 美观 ， 因 此 将 只 显示 主 刻 度 。 改 进 版 的 
drawKAndMAMore.py 范例 程序 如 下 所 示 。 


# !/usr/bin/env python 

# coding=utf-8 

import pandas datareader 

import pandas as pd 

import matplotlib.pyplot as plt 

from mpl_ finance import candlestick2 ochl 

from matplotlib.ticker import MultipleLocator 

# 根据 指定 代码 和 时 间 范 围 获取 股票 数据 

名 code='600895.ss'" 

10 stock = pandas datareader.get data yahoo(code,'2019-01-01','2019-03-31') 
11 # 删除 最 后 一 行 ， 因 为 get_data_yahoo 会 多 取 一 天 数据 

12 stock.drop(stock.index[len(stock)-1],inplace=True) 
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13 ”# 保存 在 本 地 

14 stock.to csv('D:\\stockData\ch7\\600895.csv') 

15 df = pd.read csv('D:/stockData/ch7/600895.csv',encoding='gbk',index col=0) 

16 # 设置 窗口 大 小 

17 fig, ax = plt.subplots (figsize=(10, 8)) 

18 xmajorLocator = MultipleLocator (5) # 将 x 轴 主 刻度 设置 为 5 的 倍数 

19 ax.xaxis.set major locator (xmajorLocator) 

20 # 调用 方法 绘制 K 线 图 

21 candlestick2 och] (ax = ax, opens=df["Open"] .values,closes=df["Close"] .values, 
highs=df["High"] .values, lows=df["Low"] .values,width=0.75, colorup="'red', 
colordown='green') 

22 # 如 下 是 绘制 3 种 均线 

23 df['close'].rolling(window=3) .mean() .plot (color="red",1label='3 日 均线 ') 

24 df['Close'] .rolling (window=5) .mean() .plot (color="blue",1label="'5 日 均线 ') 

25 df['Close'] .rolling (window=10) .mean() .plot (color="green",label='10 日 均线 ') 

26 plt.legend (loc='best') # 绘制 图 例 

27 ax.grid(True) # 带 网 格 线 

28 plt.title ("600895 张江 高 科 的 K 线 图 ") 

29 plt.rcParams['font.sans-serif']=['SimHei'] 

30 plt.setp(plt.gca().get xticklabels(), rotation=30) 

31 plt.show() 


与 drawKAndMA.py 范例 程序 相 比 ， 这 个 范例 程序 有 4 点 改进 。 


(1) 从 第 9 行 到 第 15 行 通过 调用 第 5 章 介绍 过 的 get_data_yahoo 方法 ， 传 入 股票 代码 、 开 始 

时 间 和 结束 时 间 这 三 个 参数 ， 从 雅虎 网 站 中 获得 股票 交易 的 数据 。 
请 注意 该 方法 返回 的 数据 会 比 传 入 的 结束 时 间 多 一 天 ， 比 如 传 入 的 结束 时 间 是 2019-03-31， 

但 它 会 返回 到 后 一 天 ( 即 2019-04-01) 的 数据 ， 所 以 在 第 12 行 调用 drop 方法 , 删除 stock 对 象 ( 该 
对 象 类 型 是 DataFrame) 最 后 一 行 的 数据 。 删除 的 时 候 是 通过 stock.index[len(stock)-1] 指 定 删除 长 度 
减 1 的 索引 值 ， 因 为 索引 值 是 从 0 开始 ， 而 且 需 要 指定 inplace=True， 否 则 的 话 ， 删 除 的 结果 无 法 
更 新 到 stock 这 个 DataFrame 数据 结构 中 。 

(2) 在 第 17 行 中 调用 figsize 方法 设置 了 窗口 的 大 小 。 

(3) 第 18 行 和 第 19 行 的 程序 代码 设置 了 主 刻度 是 5 的 倍数 。 之 所 以 设置 成 5 的 倍数 ， 是 因 
为 一 般 一 周 的 交易 日 是 5 天 。 但 这 里 不 能 简单 地 把 主 刻度 设置 成 每 周一 , 因为 某 些 周一 有 可 能 是 股 
市 休市 的 法 定 假日 。 

(4) 由 于 无 需 在 x 轴 上 设置 每 天 的 日 期 ， 因 此 这 里 无 需 再 调用 plt.xticks 方法 , 但 是 要 调用 如 
第 30 行 所 示 的 代码 ， 设 置 x 轴 刻 度 的 旋转 角度 ， 否 则 x 轴 显 示 的 时 间 依 然 有 可 能 会 相互 重合 。 


至 于 绘制 K 线 的 candlestick2_ochl 方法 和 绘制 均线 的 rolling 方法 与 之 前 drawKAndMA.py 范 
例 程序 中 的 代码 是 完全 一 致 的 。 

这 个 范例 程序 的 运行 结果 如 图 7-5 所 示 ， 从 中 可 以 看 到 改进 后 的 效果 。 由 于 本 次 显示 的 股票 时 
间 段 变 长 了 〈 是 3 个 月 ) ， 因 此 与 drawKAndMA.py 范例 程序 相 比 ， 这 个 范例 程序 均线 的 效果 更 为 
明显 ， 尤 其 是 3 日 均线 ， 几 乎 贯穿 于 整个 时 间 段 的 各 个 交易 日 。 

另外 ， 由 于 在 第 26 行 通过 调用 pltlegend(loc='best) 方 法 指定 了 图 例 将 “显示 在 合适 的 位 置 ”， 
因此 这 里 的 图 例 显示 在 效果 更 加 合适 的 左上 方 ， 而 不 是 drawKAndMA.py 范例 程序 中 的 右上 方 。 
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7.4 整合 成 交 量 


美国 的 股市 分 析 家 葛 兰 外 〈Joe Granville) 在 他 所 著 的 《股票 市 场 指标 》 一 书 里 提出 了 著名 的 
“ 量 价 理论 ”。 该 理论 的 核心 思想 是 , 任何 对 股价 的 分 析 , 如 果 离开 了 对 成 交 量 的 分 析 , 都 将 是 “无 
水 之 源 ， 无 本 之 木 ”， 因 为 成 交 量 的 增加 或 萎缩 都 表现 出 一 定 的 股价 趋势 。 

在 股票 分 析 实 践 中 ， 一 般 会 综合 性 地 分 析 K 线 、 均 线 和 成 交 量 ， 所 以 在 本 节 中 将 通过 调用 
Matplotlib 库 中 的 方法 来 绘制 股票 的 成 交 量 


7.4.1 本 书 用 的 成 交 量 是 指 成 交 股 数 


成 交 量 是 指 时 间 单 位 内 已 经 成 交 的 股 数 或 总 手数 ， 它 能 反映 出 股市 交易 中 的 供求 关系 。 其 中 
的 道理 是 比较 浅显 易 懂 的 ， 当 股票 供不应求 时 ， 大 家 争 相 购买 ， 成 交 量 就 很 大 了 ， 反 之 当 供 过 于 求 
时 ， 则 说 明 市 场 交易 冷淡 ， 成 交 量 必然 萎缩 。 

广义 的 成 交 量 包括 成 交 股 数 (Volume 或 Vol) 、 成 交 金 额 (AMOUNT， 单 位 时 间 内 已 经 成 交 
的 总 金额 数 ) 和 换 手 率 〈TUN， 股 票 每 天 成 交 量 除 以 股票 的 流通 总 股本 所 得 的 比率 ) ， 而 狭义 的 
成 交 量 则 是 指 成 交 股 数 (Volume) 。 

从 雅虎 (Yahoo) 网 站 怜 取 的 数据 中 有 表示 成 交 股 数 的 Volume 列 ， 其 中 的 单位 是 “ 股 ”， 在 
本 节 中 ， 是 通过 Volume 列 的 数据 来 绘制 股票 的 成 交 量 图 。 


7.4.2 引入 成 交 量 图 


在 K 线 和 均线 整合 成 交 量 的 图 中 ,出 于 美观 的 考虑 ,对 整合 后 的 图 提出 了 如 下 三 点 改进 要 求 。 
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(1) 绘制 上 下 两 个 子 图 ， 上 图 放 K 线 和 均线 ， 下 图 放 成 交 量 图 。 
(2) 上 下 两 个 子 图 共享 x 轴 ， 也 就 是 说 ， 两 者 x 轴 的 刻度 标签 和 间隔 应 该 是 一 样 的 。 
(3) 通过 柱状 图 来 绘制 成 交 量 图 ， 如 果 当 天 股票 上 涨 ， 成 交 量 图 是 红色 ， 下 跌 则 是 绿色 。 


在 下 面 的 drawKMAAndVol.py 范例 程序 将 示范 如 何 增加 成 交 量 图 。 


# !/usr/bin/env Python 
# coding=utf-8 
import pandas as pd 
import matplotlib.pyplot as plt 
from mpl finance import candlestick2 ochl 
from matplotlib.ticker import MultipleLocator 
# 根据 指定 代码 和 时 间 范 围 ， 获 取 股 票数 据 
df = pd.read csv('D:/stockData/ch7/600895.csv',encoding="'gbk') 
# 设置 大 小 ， 共 享 x 坐标 轴 
figure, (axPrice, axVol) = plt.subplots(2, sharex=True, figsize=(15,8)) 
# 调用 方法 ， 绘 制 K 线 图 
candlestick2_ochl (ax = axPrice, opens=df["Open"] .values, 
closes=df["Close"] .values, highs=df["High"] .values, lows=df["Low"] .values, 
width=0.75, colorup='red', colordown='green') 
axPrice.set title("600895 张江 高 科 K 线 图 和 均线 图 ") # 设置 子 图 标题 
df['Close'] .rolling (window=3) .mean () .plot (ax=axPrice,color="red", label='3 
日 均线 ') 
df['Close'] .rolling (window=5) .mean () .plot (ax=axPrice,color="blue",label="'5 
日 均线 ') 
df['Close'] .rolling (window=10) .mean () .plot (ax=axPrice,color= "green", 
label1='10 日 均线 ') 
axPrice.legend (1loc='best') # 绘制 图 例 
axPrice.set_ylabel ("价格 (单位: 元 ) ") 
axPrice.grid(True) # 带 网 格 线 
# 如 下 绘制 成 交 量子 图 
# 直方 图 表示 成 交 量 ， 用 for 循环 处 理 不 同 的 颜色 
for index, row in df.iterrows () : 

if(row['Close'] >= row['Open']): 

axVol .bar (row['Date'],row['Volume']/1000000,width 
Sloes 
axVol .bar (row['Date'],row['Volume']/1000000,width 

'green') 
axVol.set ylabel ("成 交 量 (单位 : 万 手 ) ") # 设置 y 轴 标题 
axVol.set title ("600895 张江 高 科 成 交 量 ") ”# 设置 子 图 的 标题 
axVol.set ylim(0,df['Volume'] .max()/1000000*1.2)  # 设置 y 轴 范围 
xmajorLocator = MultipleLocator (5) # 将 x 轴 主 刻度 设置 为 5 的 倍数 
axVol .xaxis.set major locator (xmajorLocator) 
axVol.grid (True) # 带 网 格 线 
# 旋转 x 轴 的 展示 文字 角度 
for xtick in axVol.get xticklabels(): 

xtick.set rotation(15) 
Pplt.rcParams['font.sans-serif'"']=["'SimHei'] 
plt.show() 
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从 第 8 行 到 第 20 行 的 程序 语句 ， 一 方面 是 从 csv 文件 中 读 取 数 据 ， 另 一 方面 在 第 一 个 子 图 中 
绘制 了 KK 线 图 和 均线 图 。 这 部 分 的 代码 与 之 前 绘制 K 线 图 和 均线 图 的 范例 程序 中 的 代码 很 相似 ， 
不 过 请 注意 两 点 。 

(1) 在 第 10 行 中 不 仅 设置 了 绘图 区 域 的 大 小 ， 还 通过 sharex=True 语句 设置 了 axPrice 和 
axVol 这 两 个 子 图 共享 的 x 轴 。 

(2) 从 第 14 行 到 第 19 行 中 ， 由 于 是 在 K 线 图 和 均线 图 的 axPrice 子 图 中 操作 ， 因 此 若干 方 
法 的 调用 主体 是 axPrice 对 象 ， 而 不 是 之 前 的 pyplotplt 对 象 。 


第 22 行 到 第 35 行 的 程序 语句 在 axVol 子 图 里 绘制 了 成 交 量 图 。 请 大 家 注意 第 22 行 到 第 26 
行 的 for 循环 。 

在 第 23 行 的 让 语句 中 ， 比 较 收 盘 价 和 开盘 价 ， 以 判断 当天 股票 是 涨 是 跌 ， 在 此 基础 上 ， 在 第 
25 行 或 第 27 行 调用 bar 方 法 ， 设 置 当日 成 交 量 图 的 填充 颜色 。 从 上 述 代码 可 知 ， 成 交 量 的 数据 来 
自 于 csv 文件 中 的 Volume 列 。 

在 绘制 成 交 量 图 的 时 候 有 两 个 细节 要 注意 。 


(1) 在 第 24 行 、 第 26 行 和 第 29 行 中 ， 在 设置 y 轴 的 刻度 值 和 范围 时 ， 都 除 以 了 一 个 相同 
的 数 。 这 是 因为 在 第 27 行 设置 y 轴 的 文字 时 ， 指 定 了 y 轴 成 交 量 的 单位 是 “万 手 ”。 比 如 1 月 2 
日 的 成 交 量 ， 从 csv 文件 中 读 取 的 数据 是 75979904， 单 位 是 股 数 ， 股 市 里 计算 成 交 量 的 单位 一 般 
是 “ 手 ”， 一 手 是 100 股 ， 所 以 1 月 2 日 的 成 交 量 也 要 换算 成 约 759799 手 ( 除 以 100) 。 在 绘制 
成 交 量 图 的 时 候 ， 用 的 是 “万 手 ”的 单位 ， 所 以 再 换算 一 下 ，759799 除 以 1 万 ,也 就 是 约 76 万 手 。 

(2) 通过 第 34 行 和 第 35 行 的 for 循环 ， 设 置 了 “x 轴 文 字 旋 转 ” 的 效果 ， 从 代码 可 知 ， 本 
范例 程序 中 的 旋转 角度 是 15 度 。 


这 个 范例 程序 的 运行 结果 如 图 7-6 所 示 ， 从 中 可 以 看 到 两 个 x 轴 刻 度 一 致 的 子 图 , 且 在 成 交 量 
子 图 中 ,上 涨 日 和 下 跌 日 的 成 交 量 填充 色 分 别 是 红色 和 绿色 (本 书 因为 黑白 印刷 的 问题 ， 看 不 到 红 
绿 颜 色 ， 具 体 颜 色 请 读者 自己 运行 一 下 本 范例 程序 ) 。 
600895 张 江 高 科 K 线 图 和 均线 图 
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图 7-6 整合 成 交 量 图 后 的 效果 图 
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7.5 通过 DataFrame 验证 均线 的 操作 策略 


本 节 无 意 深入 讲述 股票 交易 的 详细 策略 ， 只 是 通过 Pandas 库 中 DataFrame 等 对 象 来 实现 并 检 
验 一 些 股票 教科 书 上 提 到 的 均线 相关 理论 , 就 本 书 而 言 , 读者 应 当 关 注 的 是 DataFrame 等 对 象 的 相 
关 用 法 ， 而 不 是 股票 交易 策略 的 细节 。 


7.5.1 ， 葛 兰 匠 均线 八大 买卖 法 则 


在 均线 实践 理论 中 ,美国 投资 专家 葛 兰 锦 创 造 的 八 项 买卖 法 则 可 谓 经 典 ， 具 体 的 细节 如 图 7-7 
所 示 。 


向 止 第 对 大 尖 


一 一 投 价 曲 线 “~~~ 移动 平均 续 
图 7-7 葛 兰 碧 均 线 八大 买卖 法 则 示意 图 


(1) 移动 平均 线 从 下 降 逐 渐 转 为 水 平 ， 且 有 超 上 方 抬头 迹象 ， 而 股价 从 均线 下 方 突破 时 ， 为 
买 进 信 号 ， 如 图 7-7 中 的 A 点 。 

(2) 股价 在 移动 平均 线 之 上 运行 时 下 跌 ， 但 未 跌 破 均线 ， 此 时 股价 再 次 上 扬 ， 此 时 为 买 入 信 
号 ， 如 图 7-7 中 的 C 点 。 

(3) 股价 位 于 均线 上 运行 ， 下 跌 时 破 均 线 ， 但 均线 呈 上 升 趋势 ， 不 久 股价 回 到 均线 之 上 时 ， 
为 买 进 信号 ， 如 图 7-7 中 的 B 点 。 

(4) 股价 在 均线 下 方 运行 时 大 跌 ， 远 离 均线 时 向 均线 靠近 ， 此 时 为 买 进 时 机 ， 如 图 7-7 中 的 


D 点 。 
(5) 均线 的 上 升 趋势 逐渐 变 平 ， 且 有 向 下 迹象 ， 而 股价 从 均线 上 方向 下 穿 均线 ， 为 卖 出 信号， 
如 图 7-7 中 的 E 点 。 
(6) 股价 向 上 穿 过 均线 ， 不 过 均线 依然 保持 下 跌 趋 势 ， 此 后 股价 又 下 跌 回 均线 下 方 ， 为 卖 出 
信号 ， 如 图 7-7 中 的 点。 
(7) 股价 运行 在 均线 下 方 ， 出 现 上 涨 ， 但 未 过 均线 就 再 次 下 跌 ， 此 为 卖 出 点 ， 如 图 7-7 中 的 
G 点 。 
(8) 股价 在 均线 的 上 方 运行 ， 连 续 上 涨 且 继续 远离 均线 ， 这 种 趋势 说 明 随 时 会 出 现 获 利 回 吐 
的 卖 盘 打 压 ， 此 时 是 卖 出 的 时 机 ， 如 图 7-7 中 的 H 点 。 


在 上 文 提 到 的 八大 法 则 中 ， 前 四 点 是 买 进 的 时 机 ， 如 果 从 技术 面 来 分 析 ， 第 一 法 则 描述 了 构 
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筑 底部 的 形态 , 是 初次 买 入 信号 ; 第 二 法 则 描述 了 股价 在 上 升 之 后 的 回调 场景 , 一 定 程度 上 上 暗示 “大 
涨 后 的 小 幅 调整 ” 可 以 加 仓 买 进 。 第 三 法 则 描述 了 股价 构建 底部 后 的 探 底 现象 , 也 是 买 进 的 机 会 。 
第 四 法 则 描述 了 股价 下 跌 后 的 反弹 场景 ， 有 经 验 的 操盘手 一 般 会 做 短线 ， 以 快 进 快 出 策略 为 主 。 

相反 ， 后 四 点 则 是 卖 出 时 机 ， 如 果 还 是 从 技术 面 来 分 析 : 第 五 法 则 描述 了 股价 构筑 头 部 的 形 
态 ， 如 果 没 有 其 他 利好 因素 ， 此 时 应 坚决 卖 出 ; 第 六 法 则 描述 了 股价 下 跌 后 回调 的 场景 ， 也 应 坚决 
卖 出 ; 第 七 法 则 描述 了 股价 下 跌 时 的 反弹 场景 虽 有 上 调 , 但 也 应 卖 出 ; 第 八 法 则 描述 了 股价 上 升 
时 过 大 偏离 均线 的 场景 ， 此 时 可 考虑 短线 卖 出 。 


7.5.2 ”验证 基于 均线 的 买点 


根据 上 述 八大 买卖 原则 ， 对 股票 “张江 高 科 ”2019 年 1 月 到 3 月 的 交易 数据 ， 运 用 Pandas 库 
中 的 DataFrame 等 对 象 ， 根 据 5 日 均线 计算 参考 买点 ， 范 例 程 序 calBuyPointByMA.py 的 具体 代码 
如 下 。 

# !/usr/bin/env Python 

# coding=utf-8 

import pandas as pd 

# 从 文件 中 读 取 数据 

df = pd.read csv('D:/stockData/ch7/600895.csv',encoding='gbk') 
maIntervalList = [3,5,10] 

# 虽然 在 后 文中 只 用 到 了 5 日 均线 ， 但 这 里 演示 设置 3 种 均线 

for maInterval in maIntervalList: 

df['MA ' + str (maInterval)] = 

df['Close'] .rolling (window=maInterval) .mean() 

10 cnt=0 

11 while cnt<=len(df)-1: 

2 Es 

fs # 规则 1: 收盘 价 连续 三 天 上 扬 

14 if df.iloc[cnt]['Close']<df.iloc[cnt+1] ['Close'] and 
df.iloc[cnt+1] ['Close']<df.iloc[cnt+2] ['Close']: 

1 # 规则 2: 5 日 均线 连续 三 天 上 扬 

16 if df.iloc[cnt] ['MA 5']<df.iloc[cnt+1] ['MA 5'] and 
df.iloc[cnt+1] ['MA 5']<df.iloc[cnt+2] ['MA 5°']: 

7 # 规则 3: 第 3 天 收盘 价 上 穿 5 日 均线 

18 if df.iloc[cnt+1]['MA 5']>df.iloc[cnt]['Close'] and 
df.iloc[cnt+2] ['MA 5']<df.iloc[cnt+1]['Close']: 

19 print ("Buy Point on:" + df.iloc[cnt]['Date']) 

20 except: # 有 几 天 是 没有 5 日 均线 的 ， 所 以 用 except 处 理 异 常 

2 pass 

4 cnt=cnt+1 


虽然 在 计算 参考 买点 时 ,只 用 到 了 5 日 均线 ,但 在 第 8 行 和 第 9 行 的 for 循 环 中 ,通过 调用 rolling 
方法 ， 还 是 计算 了 3 日 、5 日 和 10 日 均 价 ， 并 把 计算 后 的 结果 记录 到 当前 行 的 MA_3、MA_5 和 
MA_10 这 三 列 中 ， 这 样 做 的 目的 是 为 了 演示 动态 创建 列 的 用 法 。 

在 第 11 行 到 第 22 行 的 while 循环 中 ,依次 遍历 了 每 天 的 交易 数据 ， 并 在 第 14 行 、 第 16 行 和 
第 18 行 中 ， 通 过 三 个 让 语句 设置 了 3 个 交易 规则 。 由 于 在 头 几 天 是 没有 5 日 均 价 的 ， 且 在 遍历 最 
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后 2 天 的 交易 数据 时 ， 在 执行 诸如 dfiloc[cnt+2]['Close'] 的 语句 中 会 出 现 索 引 越界 ， 因 此 在 while 循 
环 中 用 到 了 try...except 异常 处 理 语句 。 

运行 这 个 范例 程序 ， 可 以 看 到 的 结果 是 : Buy Point on:2019-03-08， 结 合 图 7-5， 可 以 看 到 3 
月 8 日 之 后 的 交易 日 中 ， 股 价 有 一 定 程 度 的 上 涨 ， 所 以 能 证 实 基于 均线 的 “ 买 ” 原 则 。 不 过 ， 在 现 
实 中 影响 股票 价格 的 因素 太 多 ， 读 者 应 全 面 分 析 ， 切 勿 在 实战 中 生 搬 硬 套 这 个 原则 来 买卖 股票 。 


7.5.3 ”验证 基于 均线 的 卖点 


类 似 地 ， 根 据 5 日 均线 计算 参考 卖点 ， 在 calSellPointByMA.py 范例 程序 中 计算 了 股票 “张江 
高 科 ”2019 年 1 月 到 3 月 内 的 卖点 。 


1 # !/usr/bin/env python 

2 # coding=utf-8 

3 import pandas as pd 

4 ， 间 从 文件 中 读 取 数据 

5 df = pd.read csv('D:/stockData/ch7/600895.csv',encoding='gbk') 
6 malIntervalList = [3,5,10] 

7 ”# 虽然 在 后 文中 只 用 到 了 5 日 均线 ， 但 这 里 演示 设置 3 种 均线 

8 for maInterval in maIntervalList: 

9 df['MA ' + str(maInterval)] = 

df['Close'] .rolling (window=maInterval) .mean() 


10 cnt=0 

11 while cnt<=len(df)-1: 

2 teys 

3 # 规则 1: 收盘 价 连续 三 天 下 跌 

14 if df.iloc[cnt]['Close']>df.iloc[cnt+1] ['Close'] and 
df.iloc[cnt+1] ['Close']>df.iloc[cnt+2] ['Close']: 

Es # 规则 2: 5 日 均线 连续 三 天 下 跌 

16 if df.iloc[cnt] ['MA 5']>df.iloc[cnt+1] ['MA 5'] and 
df.iloc[cnt+1] ['MA 5']>df.iloc[cnt+2] ['MA 5']: 

i # 规则 3: 第 3 天 收盘 价 下 穿 5 日 均线 

18 if df.iloc[cnt+1]['MA 5']<df.iloc[cnt]['Close'] and 
df.iloc[cnt+2] ['MA 5']>df.iloc[cnt+1] ['Close']: 

19 Print ("Sell Point on:" + df.iloc[cnt]['Date']) 

20 except: # 有 几 天 是 没 5 日 均线 的 ， 所 以 用 except 处 理 异 常 

2 pass 

22 cnt=cnt+1 


这 个 范例 程序 中 的 代码 与 之 前 calSellBuyByMA.py 范例 程序 这 种 的 代码 很 相似 ， 只 不 过 更 改 


2019-01-23， 这 同样 可 以 在 图 7-5 描述 的 K 线 图 中 得 到 验证 。 
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7.6 ” 量 价 理论 


根据 股市 操作 中 的 量 价 理论 ， 成 交 量 和 股票 价格 间 的 关联 关系 是 密 不 可 分 的 ， 一 般 需要 综合 
分 析 量 和 价 之 间 的 关联 关系 ,才能 进一步 分 析 并 预测 股价 变化 。 在 本 节 中 ,将 用 DataFrame 等 对 象 
来 验证 量 价 理论 。 


7.6.1 成交 量 与 股价 的 关系 


成 交 量 和 股价 问 也 存在 着 八大 规律 ， 即 量 增 价 平 、 量 增 价 升 、 量 平价 升 、 量 缩 价 升 、 量 减 价 
平 、 量 缩 价 跌 、 量 平价 跌 、 量 增 价 跌 , 随 着 上 述 周 期 过 程 , 股价 也 完成 了 一 个 从 涨 到 跌 的 完整 循环 ， 
下 面 来 具体 解释 一 下 。 


(1) 量 增 价 平 : 股价 经 过 持续 下 跌 进入 到 低位 状态 ， 出 现 了 成 交 量 增加 但 股价 平稳 的 现象 ， 
此 时 不 同 天 的 成 交 量 高 度 落 差 可 能 比较 明显 ， 这 说 明 该 股 在 底部 积聚 上 涨 动力 。 

(2) 量 增 价 升 : 成 交 量 在 低 价位 区 持续 上 升 ， 同 时 伴随 着 股价 上 涨 趋势 ， 这 说 明 股价 上 升 得 
到 了 成 交 量 的 支撑 ， 后 市 将 继续 看 好 ， 这 是 中 短线 的 买 入 信号 。 

(3) 量 平价 升 : 在 股价 持续 上 涨 的 过 程 中 ， 如 果 多 日 的 成 交 量 保持 等 量 水 平 ， 建 议 在 这 一 阶 
段 中 可 以 适当 增加 仓位 。 

(4) 量 缩 价 升 : 成交 量 开始 减少 ， 但 股价 依然 在 上 升 ， 此 时 应 该 视 情况 继续 持 股 。 但 如 果 还 
没有 买 入 的 投资 者 就 不 宜 再 重仓 介入 ， 因 为 股价 已 经 有 了 一 定 的 涨幅 ， 价 位 开始 接近 上 限 。 

(5) 量 减 价 平 : 股价 经 长 期 大 幅度 上 涨 后 , 成交 量 显著 减少 , 股价 也 开始 横向 调整 不 再 上 升 
这 是 高 位 预警 的 信号 。 这 个 阶段 里 一 旦 有 风吹草动 ， 比 如 突然 拉 出 大 阳线 和 大 阴线 ,建议 应 出 货 离 
场 ， 做 到 落 袋 为 安 。 

(6) 量 缩 价 跌 : 成 交 量 在 高 位 继续 减少 ， 股 价 也 开始 进入 下 降 通 道 ， 这 是 明确 的 卖 出 信号 。 
如 果 还 出 现 缩 量 阴 跌 ， 这 说 明 股价 底部 尚 远 ， 不 会 轻易 止 跌 。 

(7) 量 平价 跌 : 成 交 量 停止 减少 ， 但 股价 却 出 现 急速 下 滑 现象 ， 这 说 明 市 场 并 没有 形成 一 致 
看 空 的 共识 。 股 市 谚语 有 “多 头 不 死 ， 跌 势 不 止 ” 的 说 法 ， 出 现 “ 量 平价 跌 ” 的 情况 ， 说 明 主 力 开 
始 逐 渐 退 出 市 场 ， 这 个 阶段 里 ， 应 继续 观望 或 者 出 货 ， 别 轻易 去 买 入 以 所 谓 的 “ 抢 反 弹 ”。 

(8) 量 增 价 跌 : 股价 经 一 段 时 间或 一 定 幅度 的 下 跌 之 后 ， 有 可 能 出 现成 交 量 增加 的 情况 ， 此 
时 的 操作 原则 是 建议 卖 出 , 或 者 空仓 观望 。 如 果 是 低 价 区 成 交 量 有 增加 且 股 价 是 轻微 下 跌 ， 则 说 明 
有 资金 在 此 价位 区 间接 盘 , 预示 后 期 有 望 形成 底部 并 出 现 反弹 , 但 如 果 继 续 出 现 量 增 价 跌 且 跌幅 依 
然 较 大 ， 则 建议 应 清仓 出 局 。 


在 下 文中 将 通过 Python 程序 验证 量 价 理论 中 的 两 个 规则 。 


130 ”| “基于 股票 大 数据 分 析 的 Python 入 门 实战 ( 视频 教学 版 ) 


7.6.2 ”验证 “ 量 增 价 平 ”的 买点 


在 下 面 的 calBuyPointByVol.py 范例 程序 中 将 验证 “ 量 增 价 平 ” 的 买点 。 在 这 个 范例 程序 中 做 
了 三 件 事 : 第 一 是 通过 雅虎 (Yahoo) 网 站 疏 取 指定 股票 在 指定 范围 内 的 交易 数据 ;第 二 是 通过 调 
用 Pandas 库 中 的 方法 保存 爬 取 到 的 数据 ， 以 便 日 后 验证 ， 第 三 遍历 DataFrame 对 象 来 计算 量 和 价 
的 关系 ， 从 而 获得 买点 日 期 。 


1 # !/usr/bin/env Python 

加 #coding=utf-8 

3 import pandas datareader 

4 import pandas as pd 

- import numpy as np 

6 “# 涨幅 是 否 大 于 指定 比率 

4 def isMoreThanPer (lessVal,highVal,per): 

8 if np.abs (highVal-lessVal) /lessVal>per/100: 

9 return True 

10 else: 

hr return False 

12 # 涨幅 是 否 小 于 指定 比率 

13 def isLessThanPer (lessVal,highVal,per): 

14 if np.abs (highVal-lessVal)/lessVal<per/100: 

15. return True 

16 else: 

17 return False 

18 code='600895.ss' 

19 stock = pandas datareader.get_ data yahoo(code,'2018-09-01','2018-12-31') 

20 ”# 删除 最 后 一 行 ， 因 为 get_data_yahoo 会 多 取 一 天 的 股票 交易 数据 

21 stock.drop(stock.index[len(stock)-1],inplace=True) 

22 # 保存 在 本 地 

23 stock.to_csv('D:\\stockData\ch7\\60089520181231.csv') 

24 ”# 从 文件 中 读 取 数据 

25 df = pd.read csv('D:/stockData/ch7/60089520181231.csv',encoding="'gbk') 

26 cnt=0 

27 while cnt<=len(df)-1: 

25 try: 

29 # 规则 1: 连续 三 天 收盘 价 变动 不 超过 3% 

30 if isLessThanPer (df.iloc[cnt]['Close'],df.iloc[cnt+1] ['Close'],3) and 
isLessThanPer (df.iloc[cnt]['Close'],df.iloc[cnt+2] ['Close'],3) 

SE # 规则 2: 连续 三 天 成 交 量 涨幅 超过 75% 

eb if isMoreThanPer (df.iloc[cnt]['Volume'], 
df.iloc[cnt+1] ['Volume'],75) and isMoreThanPer (df.iloc[cnt]['Volume']， 
df.iloc[cnt+2] ['Volume'],75) 

3 print ("Buy Point on:" + df.iloc[cnt]['Date']) 

34 except: 

35. pass 

36 cnt=cnt+1 


在 第 7 行 定义 的 isMoreThanPer 方法 中 比较 了 高 价 和 低 价 ， 以 判断 是 否 超过 由 参数 per 指定 的 
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涨幅 。 在 第 13 行 的 isLessThanPer 方法 中 判断 了 跌幅 是 否 超 过 per 指定 的 范围 。 由 于 这 两 个 功能 经 
常会 用 到 ， 因 此 把 它们 封装 成 函数 。 

从 第 18 行 到 第 25 行 的 程序 语句 完成 了 获取 并 保存 数据 的 操作 ， 并 用 df 对象 保 存 了 要 遍历 的 
股票 数据 〈 即 股票 “张江 高 科 ”2018-09-01 到 2018-12-31 的 数据 ) 。 

在 第 27 行 到 第 36 行 是 按 日 期 遍历 股票 交易 数据 ， 并 制定 了 如 下 规则 ， 连 续 3 天 股票 的 收盘 
价 变动 范围 不 超过 5% 即 价 平 ) 且 3 天 成 交 量 的 涨幅 过 75%〈 即 量 增 ) ， 把 满足 条 件 的 日 期 打印 
出 来 。 运 行 这 个 范例 程序 后 ， 就 能 看 到 11 月 2 日 这 个 买点 。 

把 7.4.2 小 节 的 drawKMAAndVol.py 范例 程序 中 第 8 行 的 代码 改 成 如 下 , 从 60089520181231.csv 
文件 中 读 取 股票 数据 ， 再 运行 范例 程序 drawKMAAndVol01.py， 就 可 看 到 如 图 7-8 所 示 的 结果 。 


8 df = pd.read csv('D:/stockData/ch7/60089520181231.csv',encoding='gbk') 


600895 张 江 高 科 K 线 图 和 均线 图 
[] 一 一 3 日 均 续 


600895 张 江 高 科 成 交 量 


4 -T 可 6 -3 -0 -AAA 1 1 
or- 只 -8- 00) -99 -0 10) -1 0 


图 7-8 验证 “ 量 增 价 平 ”买点 的 对 照 示意 图 


从 这 个 范例 程序 的 运行 结果 可 以 看 到 验证 后 的 股价 走势 : 在 11 月 2 日 之 后 ， 股 票 的 涨幅 比较 
明显 ， 确 实 是 个 合适 的 买点 ， 这 就 是 “ 量 增 价 平 ”的 指导 意义 。 


7.6.3 ”验证 “ 量 减 价 平 ”的 卖点 


在 下 面 calSellPointByVol.py 范例 程序 中 ,同样 是 分 析 股 票 “张江 高 科 ”2018-09-01 到 2018-12-31 
的 交易 数据 , 本 次 制定 的 策略 是 : 第 一 , 还 是 连续 三 天 股票 的 收盘 价 变动 范围 不 超过 5%( 即 价 平 ); 
第 二 ， 与 第 一 日 相 比 ， 第 二 日 和 第 三 日 的 成 交 量 下 降幅 度 超过 75% 〈 即 量 减 ) 。 


1 # !/usr/bin/env python 
# coding=utf-8 
import pandas datareader 
import pandas as pd 
import numpy as np 
# 涨幅 是 否 大 于 指定 比率 
def isMoreThanPer (lessVal,highVal,per): 
if np.abs (highVal-lessVal)/lessVal>per/100: 


o vawm 必 wb 
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9 return True 
10 elses 
LE return False 


12 ”# 涨幅 是 否 小 于 指定 比率 
13 def isLessThanPer (lessVal,highVal,per): 


14 if np.abs (highVal-lessVal) /lessVal<per/100: 
15 return True 

16 else: 

by return False 


18 ”# 本 次 直接 从 文件 中 读 取 数据 

19 df = pd.read csv('D:/stockData/ch7/60089520181231.csv',encoding='gbk') 
20 cnt=0 

21 while cnt<=len(df)-1: 


22 LA 

23 # 规则 1: 连续 三 天 收盘 价 变动 不 超过 3% 

24 if isLessThanPer (df.iloc[cnt]['Close'],df.iloc[cnt+1] ['Close'],3) and 
isLessThanPer (df.iloc[cnt]['Close'],df.iloc[cnt+2] ['Close'],3) : 

25 # 规 则 2: 连续 三 天 成 交 量 跌 幅 超过 75% 

26 if isMoreThanPer (df.iloc[cnt+1] ['Volume'], 


df.iloc[cnt] ['Volume'],75) and isMoreThanPer (df.iloc[cnt+2] ['Volume'], 
df.iloc[cnt]['Volume'],75) : 


| Print ("Sell Point on:" + df.iloc[cnt]['Date']) 
28 except: 

29 pass 

30 cnt=cnt+1 


这 个 范例 程序 中 的 代码 和 7.6.2 小 节 的 calBuyPointByVol.py 范例 程序 中 的 代码 很 相似 , 只 不 过 
前 者 适当 变更 了 第 26 行 判断 “成 交 量 ” 的 if 条 件 。 这 个 范例 程序 运行 后 ， 即 可 得 到 的 卖点 是 
2018-12-05， 从 图 7-8 中 可 以 看 出 ， 在 这 段 时 间 之 后 的 若干 交易 日 里 ， 股 票 “张江 高 科 ” 的 股价 确 
实 有 下 跌 现 象 。 


7.7 ”本章 小 结 


在 本 章 中 ,首先 介绍 了 一 组 准备 知识 , 包括 NumPy 和 Pandas 库 中 相关 对 象 的 用 法 ,在 此 基础 
上 ， 通 过 范例 程序 在 K 线 图 上 整合 了 均线 。 完 成 均线 整合 后 ， 又 通过 子 图 的 形式 ， 绘 制 了 成 交 量 
图 。 最 后 通过 均线 和 成 交 量 的 相关 范例 程序 ， 让 读者 对 Python 中 的 图 形 绘制 和 数据 分 析 操 作 有 进 
一 步 的 认识 。 

在 本 章 中 还 给 出 了 若干 基于 均线 和 成 交 量 的 交易 策略 ,并 基于 Pandas 和 NumPy 等 库 实现 并 验 
证 了 这 些 策 略 ， 让 读者 熟悉 异常 处 理 、 方 法 定义 与 调用 等 实用 技能 。 
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数据 库 操作 与 绘制 MACD 线 


在 之 前 的 章节 中 ， 把 从 网 站 爬 取 到 的 数据 存储 到 csv 或 excel 文件 内 ， 不 过 这 只 能 满足 简单 的 
数据 分 析 需 求 ， 如 果 需 要 对 数据 做 进一步 的 分 析 ， 就 得 用 到 数据 库 了 。 

在 本 章 中 ， 将 把 爬虫 疏 取 到 的 股票 数据 通过 insert 语句 放 入 MySQL 数据 库 的 数据 表 中 ， 在 要 
用 的 时 候 ， 再 通过 select 语句 从 数据 表 中 提取 。 至 于 股票 相关 的 范例 程序 ， 本 章 将 讲述 比 K 线 、 均 
线 和 成 交 量 稍微 复杂 些 的 MACD 指标 线 , 与 之 前 范例 程序 不 同 的 是 , 绘制 MACD 指标 线 的 数据 是 
从 数据 库 中 提取 的 。 

在 讲述 完 MACD 指标 的 算法 和 绘制 方法 后 ， 本 章 同 样 也 会 用 Python 语言 程序 根据 MACD 指 
标 来 验证 合适 的 买点 和 卖点 。 


8.1 Python 连接 MySQL 数据 库 的 准备 工作 


在 本 节 将 介绍 MySQL 数据 库 在 本 地 的 配置 以 及 Python 连接 MySQL 数据 库 , 并 在 此 基础 上 给 
出 针对 MySQL 建 表 、 增 、 删 、 改 和 查 的 相关 范例 程序 。 


8.1.1 在 本 地 搭建 MySQL 环境 


为 了 使 用 MySQL， 需 要 在 本 地 计算 机 系统 中 安装 MySQL 服务 器 。 安 装 好 以 后 固然 可 以 通过 
命令 行 来 进行 数据 库 的 相关 操作 ， 如 创建 连接 或 执行 SQL 语句 等 。 为 了 方便 起 见 ， 可 以 通过 客户 
端 来 管理 和 操作 数据 库 及 其 数据 表 , 在 范例 程序 中 用 到 的 是 Navicat, 搭建 MySQL 服务 器 和 Navicat 
环境 的 步骤 如 下 所 示 。 

G01 下 载 并 安装 MySQL Community Server 作为 服务 器 ， 安 装 完成 后 ， 设 置 本 地 域名 为 
localhost， 端 口 是 3306， 用 户 名 是 root， 密 码 是 123456。 这 里 给 出 的 是 本 章 范 例 程序 演示 的 配置 ， 


134 基于 股票 大 数据 分 析 的 Python 入 门 实战 ( 视频 教学 版 ) 


o 


读者 可 以 根据 实际 情况 进行 调整 。 
C02 选用 Navicat for MySQL 作为 客户 端 管理 工具 ， 通 过 这 个 工具 可 以 创建 与 服务 器 的 连 
接 ， 如 图 8-1 所 示 ， 其 中 输入 连接 名 是 PythonConn， 密 码 是 之 前 设置 的 123456。 


要 秘 建 连 科 四 
第 规 [高 攻 |sst jssx Doe 
连接 各 
主机 名 或 了 ? 地址 Feaaes 
EE 
用 户 各 root 
回 保存 客 码 
连接 到 这 确定 职 消 


图 8-1 通过 Navicat 连接 MySQL 服务 器 
创建 连接 后 ， 单 击 图 8-1 中 的 “连接 测试 ”按钮 来 确认 连接 的 正确 性 ， 如 果 正 确 ， 单 击 “ 确 定 ” 


按钮 保存 该 连接 。 随 后 ， 通 过 鼠标 单 击 进入 到 这 个 连接 后 ， 就 能 看 到 其 中 的 数据 库 〈 即 Schema， 
数据 库 对 象 的 集合 ) ， 如 图 8-2 所 示 。 


MHavicat for 了 7SQL 
文件 时) 查看 W) 收 阅 夹 大 ) 工具 


甘 
= 
连接 用 户 
连接 
田 个 localhostlysql 
F Conn 


发 lass3 
forndeno 

DB hibernatechart 
infornation_schena 
装 jabcdeno 

于 wysqa 
projectchart 
springboot 

图 test 

zipkin 


图 8-2 数据 库 (Schema) 示意 图 
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8.1.2 ”安装 用 来 连接 MySQL 的 PyMySQL 库 


本 书 使 用 的 Python 版 本 是 Python 3, 所 以 要 用 PyMySQL 库 来 连接 MySQL 数据 库 , 而 Python 
2 用 的 是 MySQLdb 库 。 

在 第 5 章 介绍 过 通过 pip3 命令 来 安装 第 三 方 库 的 方法 ， 下 面 同样 在 命令 行 中 到 pip3.exe 所 在 
的 目录 里 运行 如 下 命令 ， 以 安装 PyMySQL 包 。 


Pip3 install PyMySQL 


安装 好 以 后 ， 会 看 到 如 图 8-3 所 示 的 提示 信息 。 


:\¥INDOYS\systen32\cnd. exe 


:\Python34\Scrip install PyMySQL 


图 8-3 在 命令 行 窗 口中 安装 PyMySQL 库 时 显示 的 提示 信息 


8.1.3 在 MySQL 中 创建 数据 库 与 数据 表 


接 下 来 需要 在 MySQL 中 创建 专门 用 于 股票 范例 程序 的 数据 库 ， 有 具体 步骤 是 ， 在 8.1.1 小 节 创 
建 的 PythonConn 连接 上 ， 单 击 鼠标 右键 ， 在 弹出 的 快捷 菜单 中 选择 “新 建 数据 库 ”， 如 图 8-4 所 


Ws 


Havicat for WySQL 
文件 9 查看 收 茂 天 外 工具 四 窗口 如 和 帮 助 0D 


由 总 || 相 六 尼 
连接 用 户 甫 视图 函数 


localhostlysql 


be 
关闭 接 
局 号 导 建 连 接 

前 复 二 按 
并 区 开除 和 连接 
中 及 连接 属性 


打开 数据 库 


ES 
8-4 单 击 “ 新 建 数据 库 ” 菜 单 选 项 


打开 “新 建 数据 库 ”对 话 框 ， 输 入 数据 库 名 为 pythonStock， 再 单 击 “ 确 定 ”按钮 完成 创建 ， 
如 图 8-5 所 示 。 
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图 8-5 输入 数据 库 名 


请 注意 ， 这 里 创建 的 数据 库 ( 也 叫 Schema， 即 数据 库 对象 的 集合 ) 和 之 前 创建 的 “连接 ”以 
及 后 文 将 要 创建 的 “数据 表 ” 三 者 之 间 的 关系 描述 如 下 。 


(1) 用 数据 库 连 接地 址 (比如 这 里 的 localhost) 以 及 端口 号 〈 这 里 是 3306) 能 确定 一 个 数据 
库 连 接 ， 一 个 连接 往往 对 应 一 个 连接 url。 

(2) 在 一 个 数据 库 连 接 中 , 能 创建 一 个 或 多 个 数据 库 , 本 章 刚 创建 的 数据 库 名 为 pythonStock 。 

(3) 在 一 个 数据 库 中 ， 可 以 创建 一 个 或 多 个 数据 表 ， 比 如 这 里 将 要 创建 的 数据 表 名 是 
stockInfo， 该 表 的 结构 如 表 8-1 所 示 。 


表 8-1 stocklnfo 数据 表 中 字段 的 一 览 表 


含义 
|date |vaca | 交易 昌 其 

| foat | 当天 的 开盘 价 
|cose |fox | 收盘 价 
jhigsh |noa | 最 高 从 

| moa | 最 低 价 

成 交 量 (单位 是 股 ) 

股票 代码 


8.1.4 ”通过 select 语句 执行 查询 


在 创建 完 数据 库 及 其 数据 表 后 ， 就 可 以 手动 向 stockInfo 表 里 插 入 一 条 记录 〈( 即 一 条 数据 〉， 
如 图 8-6 所 示 ， 这 是 股票 代码 为 600895 〈 张 江 高 科 ) 在 20190102 交易 日 的 交易 数据 。 


date open close hiah low vol stockCode 
bp 15.06 15. 93 16.33] 14.71 T5979904 600895 


8-6 手动 插入 一 个 记录 后 的 效果 图 
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下 面 通过 TestMySQLDB.py 范例 程序 来 演示 连接 数据 库 并 输出 stockInfo 表 中 的 数据 信息 。 


#!/usr/bin/env python 
#coding=utf-8 
import pymysql 
import sys 
import pandas as pd 
Try 
# 打开 数据 库 连 接 
db = pymysql.connect ("localhost","root","123456", "pythonstock" ) 
9 except: 
10 Print('Error when Connecting to DB.') 
1 sys.exit() 
12 cursor = db.cursor() 
13 cursor.execute("select * from stockinfo") 
14 # 获取 所 有 的 数据 ， 但 不 包含 列表 名 
15 result=cursor.fetchall() 
16 cols = cursor.description # 返回 列表 头 信息 
17 print(cols) 
E98" co = [) 
19 ”# 依次 把 每 个 cols 元 素 中 的 第 一 个 值 放 入 col 数组 


20 for index in cols: 


oaum 必 wwNP 


2 col.append (index[0]) 

22 result = list(result) # 转 成 列表 ， 方 便 存 入 DataFrame 
23 result = pd.DataFrame (result,columns=col) 

24 print (result) # 输出 结果 


25 ”# 关闭 游标 和 连接 对 象 ， 否 则 会 造成 资源 无 法 释放 


26 cursor.close() 
27 db.close() 

在 第 3 行 中 通过 import 语句 导入 了 用 于 连接 MySQL 的 Pymysql 库 。 从 第 6 行 到 第 11 行 的 程 
序 语句 通过 try...except 从 句 连接 到 MySQL 的 pythonStock 数据 库 。 

请 注意 第 8 行 的 pymysql.connect 语句 , 它 的 第 一 个 参数 表示 要 连接 数据 库 的 url, 即 localhost， 
第 二 和 第 三 个 参数 表示 连接 所 需 的 用 户 名 和 密码 , 第 四 个 参数 表示 连接 到 哪个 数据 库 。 该 方法 会 返 
回 一 个 连接 对 象 ， 这 里 是 db 对 象 。 

由 于 连接 数据 库 时 有 可 能 会 抛 出 异常 ， 因 此 在 第 9 行 中 用 except 来 接收 并 处 理 异 常 ， 在 第 10 
行 是 输出 了 错误 提示 ， 在 第 11 行 调 用 sys.exit0 退 出 程序 。 

不 妨 修改 一 下 第 8 行 的 连接 参数 ， 比 如 故意 传 入 错误 的 密码 ， 这 时 会 看 到 输出 第 10 行 的 提示 
信息 并 退出 程序 。 

在 获得 db 连接 对 象 后 ， 在 第 12 行 和 第 13 行 中 创建 了 游标 cursor 对 象 ， 并 通过 游标 来 执行 返 
回 stockInfo 表 中 所 有 数据 的 SQL 语句 ,在 第 15 行 调用 fetchall 方法 返回 stockInfo 表 里 的 所 有 数据 
并 赋值 给 result 对 象 。 请 注意 ， 这 里 result 对 象 中 只 包含 数据 ， 并 不 包含 字段 名 信息 。 

在 第 16 行 中 通过 调用 cursor.description 返回 数据 库 的 字段 信息 , 执行 第 17 行 的 打印 语句 ， 就 
能 看 到 cols 其 实 是 以 元 组 (Tuple) 的 形式 保存 了 各 字段 的 信息 ， 其 中 每 个 元 组 的 元 素 中 包含 该 字 
段 的 名 字 和 长 度 等 信息 。 


(('date', 253, None, 255, 255, 0, True), ('open', 4, None, 12, 12, 31, True).. 


138 | “基于 股票 大 数据 分 析 的 Python 入门 实 战 ( 视频 教学 版 ) 


省 略 其 他 字段 的 输出 语句 

在 第 20 行 和 第 21 行 的 for 循环 中 ， 把 每 个 cols 元 素 的 第 0 个 索引 值 (其 中 包含 字段 名 ) 放 入 
了 col 数组 ， 在 第 22 行 和 第 23 行 中 则 整合 了 stockInfo 表 的 字段 列表 和 所 有 数据 ， 并 存放 到 
DataFrame 类 型 的 result 对 象 中 。 

第 22 行 语句 把 result 强制 转换 成 列表 的 用 意 是 , 在 第 23 行 构造 DataFrame 类 型 的 对 象 时 ， 第 
一 个 参数 必须 是 列表 类 型 。 执 行 第 24 行 的 print 语句 ， 就 能 看 到 如 下 的 输出 结果 ， 其 中 包含 了 字段 
名 和 数据 。 

date open close high low vol stockCode 

0 20190102 15.06 ss93 G3 hi 75979904 600895 

在 完成 对 MySQL 数据 库 的 操作 后 , 一 定 要 执行 第 26 行 和 第 27 行 所 示 的 程序 代码 来 关闭 游标 
和 数据 库 连 接 对 象 , 如果 不 关闭 的 话 , 一 旦 数据 库 的 连接 数 到 达 上 限 ， 后续 程序 就 有 可 能 无 法 获得 


8.1.5 执行 增 、 删 、 改 操作 


在 8.1.4 小 节 的 范例 程序 中 是 通过 select 语句 读 取 数 据 ， 此 外 还 可 以 调用 PyMySQL 库 中 的 方 
法 对 MySQL 数据 库 中 的 数据 表 进 行 数据 的 插入 、 删 除 和 更 新 操作 。 在 MySQLDemoSql.py 范例 程 
序 中 示范 了 这 些 操作 。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

| import pymysql 

4 import sys 

5 try: 

6 # 打开 数据 库 连 接 

7 db = pymysql.connect ("localhost","root","123456", "PythonStock" ) 
8 except: 

9 print('Error when Connecting to DB.') 
10 SYS .exit() 

11 cursor = db.cursor() 

12 # 插入 一 条 记录 


13 insertSql="insert into stockinfo (date,openvcloserhigh,1owvvol,stockcode ) 
values ('20190103',16.65,15.31,15.78,16.24,94733382,'600895')" 

14 cursor.execute(insertSql) 

15 db.commit() # 需要 调用 commit 方法 才能 把 操作 提交 到 数据 表 中 使 之 生效 

16 ”# 删除 一 条 记录 

17 deleteSql="delete from stockinfo where stockCode = '600895' and 
date='20190103'" 

18 cursor.execute (deleteSql) 

19 db.commit() 

20 ”# 更 新 数据 

21 insertErrorSql="insert into stockinfo (date,open,close,high,low,vol, 
stockCode ) values ('201901030000',16.65,15.31,15.78,16.24,94733382, 
"E008950)” 

22 cursor.execute (insertErrorSql) # 插入 了 一 条 错误 的 记录 ，date 不 对 
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23 db.commit() 

24 updateSql="update stockinfo set date='20190103' where date="'201901030000' and 
stockCode = '600895'" 

25 cursor.execute (updateSql) 

26 db.commit() 

27 cursor.close() 

28 db.close() 


在 第 13 行 中 定义 了 一 条 执行 insert 的 SQL 语句 ， 在 第 14 行 通过 调用 cursor.execute 方法 执行 
了 这 条 SQL 语句 。 如 果 不 执行 第 15 行 的 db.commit0 语 句 ， 第 13 行 的 insert 语句 就 不 会 生效 。 

从 第 17 行 到 第 19 行 的 程序 语句 中 ,通过 delete 语句 示范 了 删除 数据 的 用 法 ,同样 请 注意 , 在 
第 18 行 执行 完 cursor.execute 之 后 ， 也 需要 在 第 19 行 调用 db.commit() 方 法 使 delete 操作 生效 。 

从 第 21 行 到 第 23 行 的 程序 语句 中 ,插入 了 一 个 错误 的 记录 ,该 记录 中 ,日 期 是 '201901030000'， 
正确 的 应 该 是 20190103'， 所 以 在 第 24 行 到 第 26 行 通过 update 语句 更 新 了 这 条 记录 。 

其 实 这 个 范例 程序 执行 了 四 个 针对 数据 库 的 操作 : 第 一 是 插入 了 股票 代码 为 600895， 日 期 是 
20190103 的 交易 数据 ， 第 二 是 删除 了 该 条 记录 ; 第 三 是 插入 了 股票 600895 日 期 是 201901030000 
的 数据 ;第 四 是 把 第 三 个 操作 中 插入 数据 中 的 日 期 改 为 20190103 。 

至 此 , 在 数据 库 中 应 该 是 多 了 一 个 代码 为 600895 日 期 是 20190103 的 交易 记录 ( 即 交 易 数据 )， 
如 果 通 过 Navicat 客户 端 来 查看 stockInfo 表 ， 就 能 验证 这 个 插入 操作 的 结果 ， 如 图 8-7 所 示 ， 其 中 
第 二 行 即 为 新 插入 的 交易 数据 。 


4 open lclose high llow lvol stockCode 
15.06 15.93 16.33 14.71 75979904 600895 
20190103 16.65 15.31 15.78 16.24 94733382 600895 


图 8-7 新 插入 交易 数据 后 的 结果 图 


在 插入 数据 的 时 候 还 需要 注意 一 点 , 在 insert 语句 中 的 values 关键 字 之 前 , 需要 详细 给 出 字段 
列表 ， 而 之 后 的 多 个 值 是 一 一 和 字段 列表 相对 应 。 

insert into stockinfo (date,open,close,high,1low,vol,stockCcode ) values 
('20190103',16.65,15.31,15.78,16.24,94733382, '600895') 

当然 ， 在 这 个 范例 程序 中 如 果 不 写 字段 列表 ， 语 法 上 也 没 问题 ， 也 能 正确 地 插入 数据 ， 但 这 
样 的 话 ， 不仅 代码 的 可 读 性 很 差 ， 其 他 人 就 更 难 理解 插入 的 值 究竟 对 应 到 哪个 字段 。 而且， 如 果 当 
新 增 了 字段 时 ， 比 如 在 date 和 open 之 间 插 入 了 amount (成 交 金 额 ) 字段 ， 那么 values 之 后 的 第 二 
个 参数 16.65 就 会 对 应 到 “成 交 金额 ”， 而 不 是 之 前 所 预期 的 “开盘 价 ”， 从 而 给 后 续 程序 的 维护 
和 升级 留 下 隐患 。 


8.1.6 ”事务 提交 与 回 滚 


在 8.1.5 小 节 的 增删 改 操 作 之 后 ， 都 带 了 一 句 db.commit()， 这 是 “操作 提交 ”或 “事务 提交 ” 
的 意思 ， 和 否则 的 话 ， 增 删改 操作 无 法 真正 更 新 到 数据 表 中 。 

在 实际 的 程序 项 目 中 ， 经 常会 遇 到 一 组 “要 么 全 都 做 ， 要 么 全 都 不 做 ”的 事务 性 操作 。 在 
PyMySQL 库 中 ， 除 了 有 提交 事务 的 commit 方法 外 ， 还 有 回 滚 事务 的 rollback 方法 。 在 下 面 的 
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MySQLTransaction.py 范例 程序 中 将 示范 提交 事务 和 回 滚 事 务 的 用 法 。 


1 # !/usr/bin/env python 

2 # coding=utf-8 

a import pymysql 

4 import sys 

5 try: 

6 # 打开 数据 库 连 接 

纪 db = pymysql.connect ("localhost", "root","123456", "PythonStock") 

8 except: 

9 Print('Error when Connecting to DB.') 

10 SYS .exit() 

11 cursor = db.cursor() 

E20 Cr 

3 # 插入 2 条 记录 

14 insertSqll="insert into stockinfo (date,open,close,high,1low,vol, 
stockCode ) values ('20190103',16.65,15.31,15.78,16.24,94733382,'600895')" 

5 cursor.execute (insertSql1) 

16 raise Exception 

ry insertSql2="insert into stockinfo (date,open,close,high,1low,vol, 
stockCode ) values ('20190104',16.58,15.60,15.70,16.30,68985635,'600895')" 

18 cursor.execute (insertSql2) 

19 db.commit () # 没 问题 就 提交 

20 except: 

2 print ("Error happens, rollback.") 

有 db.rollback() 

2 Finellys 

24 cursor.close() 

2 db.close() 


在 第 12 行 到 第 19 行 的 try 从 句 中 有 两 条 insert (插入 ) 语句 , 但 请 注意 , 对 这 两 条 insert 语句 ， 
只 在 第 19 行 写 了 一 条 commit 语句 。 

在 第 20 行 到 第 22 行 的 except 从 句 中 , 编写 了 打印 错误 提示 信息 的 语句 和 调用 rollback 方法 执 
行 回 滚 操作 的 语句 。 根 据 第 4 章 中 关于 异常 处 理 的 介绍 可 知 , 不 管 是 否 发 生 了 异常 ， 以 及 无 论 发 生 
了 何 种 异常 ,finally 从 句 中 的 语句 块 一 定 会 被 执行 ， 所 以 这 个 范例 程序 把 关闭 游标 和 关闭 数据 库 连 
接 的 语句 编写 到 第 23 行 到 第 25 行 的 finally 从 句 中 。 

请 读者 注意 ， 在 第 16 行 中 通过 raise 语句 抛 出 了 异常 。 虽 然 在 抛 出 异常 之 前 ， 已 经 在 第 15 行 
通过 execute 语句 执行 了 一 条 insert 语句 ， 但 由 于 在 except 从 句 的 第 22 行 执行 了 rollback 操作 ， 因 
此 这 两 条 insert 语句 不 会 被 提交 ， 可 以 到 stockInfo 数据 表 中 去 验证 这 个 结果 。 

这 个 范例 程序 通过 raise 语句 显 式 地 抛 出 异常 ， 如 果 去 掉 这 条 语句 ， 但 同时 故意 写 错 insert 语 
句 的 语法 ， 比 如 在 第 17 行 insert 语句 中 故意 多 写 了 一 个 不 存在 的 字段 ， 那 么 同样 会 因为 抛 出 异常 
而 执行 回 滚 操作 ， 这 两 条 insert 语句 同样 不 会 生效 。 

但 是 ， 如 果 去 掉 这 条 raise 语句 ， 由 于 无 异常 发 生 ， 那 么 会 通过 第 19 行 的 commit 完成 事务 提 
交 ， 这 样 的 话 ， 就 能 在 stockInfo 表 中 看 到 两 条 新 插入 的 记录 。 
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8.2 ”整合 息 虫 模块 和 数据 库 模块 


MySQL 是 存储 数据 的 载体 ， 在 实际 的 程序 项 目 中 ， 一 般 会 从 各 种 途径 导入 数据 ， 比 如 在 本 节 
中 ， 将 把 从 网 站 假 取 到 的 数据 通过 调用 PyMySQL 库 提供 的 方法 存 入 数据 库 。 


8.2.1 ”根据 股票 代码 动态 创建 数据 表 


在 8.1 节 ， 范 例 程序 是 把 所 有 股票 的 信息 都 放 在 stockInfo 表 中 ， 所 以 该 表 包 含 用 于 区 分 股票 
的 stockCode 字段 。 

下 面 为 每 个 股票 创建 自己 的 表 ， 表 名 的 形式 是 stock 股票 代码 ， 比 如 在 stock_300776 表 中 存 
放 的 是 代码 为 300776 帝 尔 激光 〉 的 股票 信息 。 由 于 已 经 能 通过 表 名 标识 股票 代码 ， 因 此 在 创建 
此 类 数据 表 时 ， 无 需 再 加 入 描述 股票 代码 的 stockCode 字段 。 

在 下 面 的 CreateTablesByCode.py 范例 程序 中 ， 首 先是 通过 第 5 章 介绍 过 的 Tushare 库 获 取 所 
有 的 股票 代码 ， 其 次 会 通过 for 循环 ， 以 此 为 每 个 股票 创建 数据 表 ， 具 体 的 程序 代码 如 下 。 
# !/usr/bin/env python 
# coding=utf-8 
import pymysql 
import sys 
import tushare as ts 


try: 

# 打开 数据 库 连 接 

db = pymysql.connect ("localhost","root","123456", "pythonstock" ) 
9 except: 


oIMAMAWOp 


10 Print('Error when Connecting to DB.') 
11 sys.exit() 

12 cursor = db.cursor() 

13 vv 


14 stockList=['600895',"'603982',"'300097','603505','600759'] 
15 for code in stockList: 


16 二 二 

Eh createSql= 'CREATE TABLE stock ' +code+' ( date varchar(255) ,open 
float,close float ,high float , low float,vol int(11))" 

18 cursor.execute (createSql) 

19 except: 

20 Print('Error when Creating table for:' + code) 

2 Vn 


22 stockList=ts.get stock basics() # 通过 Tushare 接口 获取 股票 代码 

23 for code in stockList.index: 

24 try: 

25 createSql= 'CREATE TABLE stock ' +code+' ( date varchar(255) ,open 
float,close float ,high float , low float,vol int(11))" 

26 #int (createSql) 
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2 cursor.execute (CreateSql) 
28 except: 
29 print('Error when Creating table for:' + code) 


30 db.commit() 
31 cursor.close() 
32 db.close() 


在 第 6 行 到 第 12 行 中 ， 像 之 前 那样 连接 到 了 MySQL 数据 库 ， 首 先 注释 掉 第 14 行 第 20 行 的 
代码 。 

在 第 22 行 的 代码 中 调用 了 Tushare 库 的 get_stock_basics 方法 ， 获 取 到 了 所 有 的 股票 代码 ， 并 
在 第 23 行 到 第 29 行 的 for 循环 中 ， 以 此 读 取 stockList 对 象 中 的 code 信息 ， 并 在 25 行 的 create 语 
句 中 通过 code 组 装 创建 表 的 create 语句 。 

注意 , 范例 程序 是 在 for 循环 中 把 每 个 创建 表 的 create 语句 包 在 try...except 从 句 里 , 这样 做 的 
目的 是 ， 一 旦 当前 创建 数据 表 的 语句 出 现 异 常 ， 不 是 中 止 程序 ， 而 只 是 中 止 创建 当前 code 表 的 操 
作 ， 这 样 就 会 把 异常 造成 的 影响 缩小 在 最 小 范围 。 另 外 ， 在 处 理 异 常 except 从 句 的 29 行 ， 打 印 了 
出 现 建 表 错误 的 code 信息 ， 这 样 当 程序 运行 结束 后 ， 即 使 出 现 问题 ， 也 能 手动 创建 数据 表 。 

在 第 30 行 中 通过 调用 commit 方法 执行 了 提交 操作 ， 第 31 行 和 第 32 行 的 程序 代码 用 于 关闭 
对 游标 和 数据 库 的 连接 。 运 行 这 个 范例 程序 后 ， 就 能 在 MySQL 的 pythonStock 库 中 看 到 已 创建 好 
了 多 张 表 。 

如 果 不 想 为 所 有 股票 代码 都 创建 数据 表 ， 即 只 是 想 创建 指定 股票 代码 的 数据 表 ， 那 么 可 以 注 
释 掉 第 22 行 到 第 29 行 的 代码 , 同时 去 掉 第 14 行 到 第 20 行程 序 语句 的 注释 , 这 样 就 只 会 创建 由 第 
14 行 指定 的 股票 代码 的 数据 表 。 


8.2.2 ”把 礁 取 到 的 数据 存 入 数据 表 


在 为 每 个 股票 创建 好 相应 的 数据 表 之 后 ， 可 以 通过 候 虫 从 雅虎 (Yahoo) 网 站 候 取 指定 股票 代 
码 对 应 的 交易 数据 ， 并 存 入 对 应 的 数据 表 中 。 本 节 的 InsertDataFromYahoo.py 范例 程序 比较 长 ， 下 
面 分 若干 段 来 讲解 。 
1 # !/usr/bin/env python 
# coding=utf-8 
3 import pymysql 
4 import sys 
本 import tushare as ts 
6 import pandas as pd 
到 import pandas datareader 
8 


try: 
9 # 打开 数据 库 连 接 
10 db = pymysql.connect ("localhost","root","123456", "pythonSstock" ) 
11 except: 
12 Print('Error when Connecting to DB.') 
13 SYS .exit() 


14 cursor = db.cursor() 


第 8 行 到 第 14 行 的 程序 代码 打开 了 MySQL 数据 库 的 连接 , 并 在 第 14 行 创 建 了 用 于 操作 数据 
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的 cursor 游标 对 象 。 
15 # 从 网 站 息 取 数据 ， 并 插入 到 对 应 的 数据 表 中 


16 def insertStockData (code,startDate,endDate): 


E73 让: 

18 filename='D:\\stockData\ch8\\'+codetstartDatetendDate+' .csv' 

19 stock = pandas datareader.get data yahoo(codet+'.ss',startDate, 
endDate) 

20 ifE(len(stock)<1) : 

21 stock= pandas datareader.get data yahoo(codet+'.sz',startDate, 
endDate) 

2 # 删除 最 后 一 行 ， 因 为 get_data_yahoo 会 多 取 一 天 的 股票 交易 数据 

23 stock.drop (stock.index[len (stock) -1],inplace=True)  # 在 本 地 留 份 csv 

24 Print('Current handle:' + code) 

号 Stock.to_csv(filename) 

26 df = pd.read_csv(filenamevencoding='"gbk'") 

27 cnt=0 

28 while cnt<=len (df)-1: 

29 date=df.iloc[cnt] ['Date'] 

30 open=df.iloc[cnt] ['Open'] 

3 close=df.iloc[cnt] ['Close'] 

3 high=df.iloc[cnt] ['High'] 

加 六 | low=df.iloc[cnt]['Low'] 

34 vol=df.iloc[cnt] ['Volume'] 

35 tableName='stock_'+code 

36 values = [date,float (open),float (close),float (high), 
float (low) ,int (vol)] 

3 insertSql='insert into '+tableName+' (date,open,close,high,1low,vol) 
Values (%s,%s,%s,%s,%s,%s)' 

38 cursor.execute (insertSql, values) 

a9 cnt=cnt+1 

40 db.commit () 

41 except Exception as e: 

42 print('Error when inserting the data of:' + code) 

43 Print (repr (e)) 

44 db.rollback () 


在 第 16 行 到 第 44 行 定义 的 insertStockData 方法 中 , 从 第 18 pe 21 行 的 程序 语句 通过 雅虎 
(Yahoo) 网 站 息 取 了 股票 交易 数据 ， 其 中 参数 code 指定 了 股票 ， 而 股票 交易 数据 的 开始 时 间 和 

结束 时 间 则 由 startDate 和 endDate 两 个 参数 来 指定 。 
请 注意 ，pandas_datareader.get_data_yahoo 方法 在 爬 取 沪 市 的 股票 时 ， 需 要 加 上 .ss 的 后 级 ， 在 
怜 取 深圳 的 股票 时 ， 需 要 加 上 .sz 的 后 经， 所 以 首先 需要 在 第 19 行 用 code 加 .ss 的 后 缀 以 沪 市 股票 
的 代码 形式 去 息 取 股票 交易 数据 ， 如 果 没 扑 取 到 ， 则 在 第 21 行 用 .sz 的 后 缀 再 去 扑 取 一 次 。 在 第 
23 行 中 ， 需 要 删除 最 后 一 行 的 数据 ， 因 为 之 前 讲 过 ，pandas_datareader.get_data_yahoo 方法 会 多 返 

一 个 交易 日 的 股票 交易 数据 。 
数据 仆 取 完成 之 后 ， 通 过 第 25 行 的 程序 代码 把 数据 存 入 到 csv 格式 的 文件 中 ， 以 便 在 本 地 留 
存 一 份 股票 交易 数据 。 

从 第 28 行 到 第 44 行 的 程序 语句 通过 while 循环 , 依次 遍历 了 从 csv 文件 中 读 取 到 数据 df 对 象 
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(数据 类 型 为 DataFrame) 。 在 每 次 遍历 中 ， 从 第 29 行 到 第 34 行 的 程序 语句 ， 指 定 了 具体 日 期 的 
票 交易 数据 , 在 第 35 行 中 指定 了 插入 数据 表 的 名 字 ， 这 和 8.2.1 小 节 创建 数据 表 的 格式 一 致 ， 都 
是 'stock， 加 股票 代码 。 

在 第 37 行 的 insert 语句 中 的 values 设置 值 中 ， 用 6 个 %s 作为 占 位 符 ， 依 次 和 values 之 前 的 
字段 列表 相对 应 。 在 第 38 行 执行 的 cursor.execute 方法 中 ， 还 传 入 了 values 这 个 参数 ， 这 个 参数 是 
在 第 36 行 设 置 的 值 ， 用 来 指定 要 插入 的 具体 值 。 

请 注意 第 17 行 的 try 语句 和 41 行 的 except 从 名 ,如 果 没 出 现 问题 , 则 会 执行 第 40 行 的 commit 
语句 向 数据 表 中 提交 插入 操作 ， 如 果 出 现 异常 ， 则 会 执行 except 从 句 中 的 第 42 行 和 第 43 行 来 输 
出 提示 ， 并 在 第 44 行 执 行 回 滚 操作 。 也 就 是 说 ， 如 果 插 入 某 个 股票 代码 的 数据 出 现 异 常 ， 那 么 该 
股票 指定 时 间 范 围 内 的 所 有 交易 数据 都 不 会 进入 到 数据 表 中 。 

调用 该 方法 的 用 户 能 在 这 个 范例 程序 运行 结束 后 ， 根 据 错 误 提 示 知 道 哪些 股票 代码 有 问题 ， 
然后 再 手动 解决 。 

45 startDate='2018-09-01' 

46 endDate='2019-05-31' 

47 stockList=['600895',"'603505','600759'] 

48 for code in stockList: 

49 insertStockData (code, startDate,endDate) 
0 

51 stockList=ts.get stock basics () # 通过 Tushare 接口 获取 股票 代码 
52 for code in stockList.index: 

53 insertStockData (code, startDate, endDate) 
54 50 

55 cursor.close() 

56 db.close() 

在 第 45 行 和 第 46 行 中 定义 了 获取 股票 交易 数据 的 起 始 时 间 和 结束 时 间 ， 读 者 在 运行 本 范例 
程序 时 ， 可 以 根据 实际 情况 手动 调整 。 在 第 48 行 和 第 49 行 的 for 循环 中 依次 对 第 47 行 指定 的 
stockList 对 象 中 的 每 个 股票 代码 调用 insertStockData 方法 ， 如 果 一 切 顺利 的 话 ， 在 对 应 的 数据 表 中 
即 可 看 到 指定 时 间 范 围 内 的 股票 交易 数据 。 

如 果 把 第 50 行 到 第 54 行 的 注释 去 掉 , 则 可 以 通过 调用 第 50 行 的 get_stock_basics 方法 获取 所 
有 股票 代码 ， 再 通过 第 52 行 到 第 53 行 的 for 循环 ， 依 次 候 取 指定 股票 代码 的 交易 数据 并 插入 到 数 
据 库 中 。 

需要 注意 的 是 ， 如 果 通 过 第 51 行 到 第 53 行 来 遍历 并 插入 所 有 股票 的 交易 数据 ， 范 例 程 序 运 
行 的 时 间 可 能 比较 长 , 此 时 如 果 对 MySQL 数据 库 中 的 数据 表 再 执行 其 他 操作 , 则 可 能 会 导致 锁 表 。 
因此 建议 大 家 如 果 没 有 实际 的 需要 ， 可 以 像 第 47 行程 序 语句 那样 指定 股票 代码 ， 只 处 理 有 分 析 需 
求 的 股票 数据 。 

第 55 行 和 第 56 行 是 通过 调用 close 语句 来 关闭 游标 和 数据 库 连 接 对 象 ,没有 这 两 条 语句 的 话 ， 

最 后 ， 再 请 读者 回顾 一 下 本 范例 程序 中 的 异常 处 理 方式 。 


(1) 如 果 在 处 理 某 个 股票 代码 时 发 生 异 常 ， 本 着 “异常 影响 范围 应 当 最 小 ”的 原则 ， 该 范例 
程序 只 是 中 止 了 当前 股票 代码 的 处 理 ， 并 没有 中 止 对 其 他 股票 代码 的 处 理 。 
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(2) try...except 从 句 是 编写 在 insertStockData 方法 中 的 ， 可 以 想象 一 下 ， 如 果 本 来 该 往 一 个 
股票 数据 表 中 插入 100 条 记录 , 假设 插入 第 50 条 记录 时 出 错 了 , 此 时 再 插入 其 他 记录 也 没 意 义 了 。 
因为 缺失 数据 会 导致 分 析 结 论 出 错 , 所 以 本 范例 程序 的 处 理 方式 是 : 出 错 了 就 回 滚 该 股票 的 所 有 揪 
入 操作 ， 只 有 确认 该 股票 代码 指定 时 间 范 围 内 的 所 有 交易 数据 都 成 功 插入 了 ， 才 执行 commit 进行 
提交 ， 以 确保 数据 的 完整 性 和 准确 性 。 


8.3 绘制 MACD 指标 线 


MACD 中 文 全 称 是 “平滑 异同 移动 平均 线 ”， 英 文 全 称 是 Moving Average Convergence 
Divergence。 它 是 查 拉 尔 . 阿 佩 尔 (Geral Appel) 在 1979 年 提出 的 。MACD 是 通过 短期 (一般 是 12 
日 ) 移动 平均 线 和 长 期 (一般 是 26 日 ) 移动 平均 线 之 问 的 聚合 与 分 离 情况 ， 来 研判 买卖 时 机 的 技 
术 指 标 。 


8.3.1 MACD 指标 的 计算 方式 


从 数学 角度 来 分 析 ，MACD 指标 是 根据 均线 的 构造 原理 ， 对 股票 收盘 价 进行 平滑 处 理 ， 计 算 
出 算术 平均 值 以 后 再 进行 二 次 计算 ， 它 是 属于 趋向 类 指标 。 

MACD 指标 是 由 三 部 分 构成 的 ， 分 别 是 : DIF 〈 离 差 值 ， 也 叫 差 离 值 ) 、DEA 〈 离 差 值 平均 ) 
和 BAR (柱状 线 ) 。 

具体 的 计算 过 程 是 ， 首 先 算出 快速 移动 平均 线 (EMA1) 和 慢 速 移动 平均 线 (EMA2) ， 用 这 
两 个 数值 来 测量 两 者 间 的 差 离 值 CDIF) ， 在 此 基础 上 再 计算 差 离 值 (DIF) N 周期 的 平滑 移动 平 
均线 DEA (也 叫 MACD、DEM) 线 。 

如 前 文 所 述 ，EMAI1 周期 参数 一 般 取 12 日 ，EMA2 一 般 取 26 日 ， 而 DIF 一 般 取 9 日 ， 在 此 
基础 上 ，MACD 指标 的 计算 步骤 如 下 所 示 。 


《EX6i 计算 移动 平均 值 ( 即 EMA )。 


12 日 EMAI 的 计算 方式 是 : EMA (12) = 前 一 日 EMA (12) x 11/13 十 今日 收盘 价 x 2/13 
26 日 EMA2 的 计算 方式 是 EMA (26) = 前 一 日 EMA (26) x 25/27 十 今日 收盘 价 x2 /27 


E302 计算 MACD 指标 中 的 差 离 值 ( 即 DIF )。 
DIF= 今日 EMA (12) 一 今日 EMA (26) 


CT03 计算 差 离 值 的 9 日 EMA ( 即 MACD 指标 中 的 DEA )。 用 差 离 值 计算 它 的 9 日 EMA， 
这 个 值 就 是 差 离 平均 值 ( DEA )。 


今日 DEA (MACD) = 前 一 日 DEA x 8/10 十 今日 DIF x 2/10 
GI04 计算 BAR 柱状 线 。 


BAR=2x(DIF 一 DEA) 
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这 里 乘 以 2 的 原因 是 ， 在 不 影响 趋势 的 情况 下 ， 从 数值 上 扩大 DIF 和 DEA 差 值 ， 这 样 观察 效 
果 就 更 加 明显 。 

最 后 ， 把 各 点 〈 即 每 个 交易 日 ) 的 DIF 值 和 DEA 值 连接 起 来 ， 就 能 得 到 在 x 轴 上 下 移动 的 两 
条 线 ， 分 别 表 示 短 期 〈 即 快速 ，EMA1， 周 期 是 12 天 ) 和 长 期 ( 即 慢 速 ， EMA2， 周 期 是 26 天) 。 
而 且 ，DIF 和 DEA 的 离 差 值 能 构成 红 、 绿 两 种 颜色 的 柱状 线 ， 在 x 轴 之 上 是 红色 ， 而 x 轴 之 下 是 
绿色 。 


8.3.2 ”遍历 数据 表 数 据 ， 绘 制 MACD 指标 


同 K 线 指标 一 样 ， 根 据 不 同 的 计算 周期 ， MACD 指标 也 可 以 分 为 日 指标 、 周 指标 、 月 指标 
乃至 年 指标 。 在 下 面 的 DrawMACD.py 范例 程序 中 将 绘制 日 MACD 指标 ， 在 这 个 范例 程序 中 可 以 
看 到 关于 数据 结构 、 图 形 绘制 和 数据 库 相 关 的 操作 ， 由 于 程序 代码 比较 长 ， 下 面 分 段 讲解 。 

1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 import pandas as pd 

4 import matplotlib.pyplot as plt 
import pymysql 
6 

六 

8 


import sys 
# 第 一 个 参数 是 数据 ， 第 二 个 参数 是 周期 
def calEMA(df, term): 


9 for i in range(len(df)): 

10 if i==0: # 第 一 天 

3 df.ix[i, 'EMA']=df.ix[i,'close'] 

3 Ta 

3 df.ix[i, 'EMA']=(term-1)/ (term+1)*df.ix[i-1, 'EMA']+2/ (term+1) * 
df.ix[i,'close'] 

14 EMAList=1list (df['EMA']) 

15 return EMAList 


在 第 8 行 到 第 15 行 的 calEMA 方法 中 ， 根 据 第 二 个 参数 term， 计 算 快 速 ( 周 期 是 12 天 ) 和 
慢 速 (周期 是 26 天 ) 的 EMA 值 。 

有 具体 步骤 是 ， 通 过 第 9 行 的 for 循环 ， 遍 历 由 第 一 个 参数 指定 的 DataFrame 类 型 的 df 对 象 ， 
根据 第 10 行 的 让 条 件 中 ， 如 果 是 第 一 天 ， 则 EMA 值 用 当天 的 收盘 价 ， 如 果 满 足 第 12 行 的 条 件 ， 
即 不 是 第 一 天 ， 则 在 第 13 行 中 根据 8.3.1 小 节 的 算法 ， 计 算 当 天 的 EMA 值 。 

请 注意 ， 在 第 11 行 和 第 13 行 中 是 通过 dfix 的 形式 访问 索引 行 〈 比 如 第 i 行 ) 和 指定 标签 列 

〈 比 如 EMA 列 ) 的 数值 ，ix 方法 与 之 前 loc 以 及 iloc 方法 不 同 的 是 ，ix 方法 可 以 通过 索引 值 和 标 
签 值 访 问 ， 而 loc 以 及 iloc 方法 只 能 通过 索引 值 来 访问 。 计 算 完 成 后 ， 在 第 14 行 把 df 的 EMA 列 
转换 成 列表 类 型 的 对 象 并 在 第 15 行 返回 。 

16 ”# 定义 计算 MACD 的 方法 
17 def calMACD(df, shortTerm=12, longTerm=26, DIFTerm=9): 
18 ShortEMA = calEMA(df, shortTerm) 


19 longEMA = calEMA (df, longTerm) 
20 df['DIF'] = pd.Series (shortEMA) - pd.Series (longEMA) 
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oh for i in range(len(df)): 

22 TE A # 第 一 天 

23 df.ix[i, 'DEA'] = df.ix[i,'DIF'] # ix 可 以 通过 标签 名 和 索引 来 获取 数据 

24 if i>0: 

25 df.ix[i,'DEA'] = (DIFTerm-1)/(DIFTerm+1)*df.ix[i-1,'DEA'] + 
2/ (DIFTerm+1)*df.ix[i,'DIF'] 

26 df['MACD'] = 2*(df['DIF'] - df['DEA']) 

27 return df[['date', 'DIF', 'DEA', 'MACD']] 

28 # return df 


在 第 15 行 到 第 27 行 定义 的 calMACD 方法 中 , 将 调用 第 8 行 定 义 的 calEMA 方 法 来 计算 MACD 
的 值 。 具 体 步 骤 是 ， 在 第 18 行 和 第 19 行 通过 调用 calEMA 方法 ， 分 别 得 到 了 快速 和 慢 速 的 EMA 
值 ， 在 第 20 行 ， 用 这 两 个 值 计算 DIF 值 。 请 注意 ，shortEMA 和 longEMA 都 是 列表 类 型 ， 所 以 可 
以 像 第 20 行 那样 ， 通 过 调用 pd.Series 方法 把 它们 转换 成 Series 类 对 象 后 再 直接 计算 差 值 。 

从 第 21 行 到 第 25 行 的 程序 语句 ， 也 是 根据 8.3.1 小 节 给 出 的 公式 计算 DEA 值 ， 同 样 要 用 两 
条 让 语句 区 分 “第 一 天 ”和 “以 后 几 天 ”这 两 种 情况 ， 在 第 26 行 根据 计算 公式 算出 MACD 的 值 。 

第 27 行 返 回 指定 的 列 ， 在 后 面 的 代码 中 还 要 用 到 df 对 象 的 其 他 列 ， 此 时 则 可 以 用 如 第 28 行 
所 示 的 代码 返回 df 的 全 部 列 。 


29 try 

30 # 打开 数据 库 连 接 

和 db = pymysql.connect ("localhost", "root","123456", "pythonStock" ) 
32 except: 

33 print('Error when Connecting to DB.') 

34 SYS .exit() 


35 cursor = db.cursor() 

36 cursor.execute("select * from stock 600895") 
37 cols = cursor.description # 返回 列 名 

38 heads = [] 

39 ”# 依次 把 每 个 cols 元 素 中 的 第 一 个 值 放 入 col 数组 
40 for index in cols: 

41 heads .append (index[0]) 

42 result = cursor.fetchall() 

43 df = pd.DataFrame (list (result)) 

44 df.columns=heads 

45 # print(calMACD (df，12，26，9)) # 输出 结果 
46 stockDataFrame = calMACD(df, 12, 26, 9) 


从 第 29 行 到 第 35 行 的 程序 语句 , 建立 了 MySQL 数据 库 的 连接 和 获得 游标 cursor 对 象 , 在 第 
36 行 中 ， 通 过 select 类 型 的 SQL 语句 ， 来 获取 stock 600895 表 中 的 所 有 数据 ， 如 8.2 节 所 述 ， 这 
个 数据 表 中 的 数据 源 自 雅 虎 网 站 。 

在 第 37 行 中 ， 得 到 了 stock_600895 数据 表 的 字段 列表 。 在 第 40 行 和 第 41 行 的 for 循环 中 ， 
把 字段 列表 中 的 第 0 行 索引 元 素 放 入 了 heads。 在 第 42 行 和 第 43 行 ， 把 从 stock 600895 数据 表 中 
获取 的 数据 放 入 到 df 对象。 在 第 44 行 的 程序 语句 ， 把 包含 数据 表 字 段 列表 的 heads 对 象 赋值 给 df 
对 象 的 字段 。 

执行 到 这 里 ， 如 果 去 掉 第 45 行 打印 语句 的 注解 ， 就 能 看 到 第 一 列 输出 的 是 字段 名 列表 ， 之 后 
会 按 天 输出 与 MACD 有 关 的 股票 指标 数据 。 
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在 第 46 行 调用 了 calMACD 方法 ， 并 把 结果 赋值 给 stockDataFrame 对 象 ， 之 后 就 可 以 根据 
stockDataFrame 对 象 中 的 值 开 始 绘图 。 


47 开始 绘图 

48 plt.figure() 

49 stockDataFrame['DEA'] .Plot(color="red",1abel='DERA') 
50 stockDataFrame['DIF'] .plot(color="blue",1label="'DIF') 
51 plt.legend(1loc='best') # 绘制 图 例 

52 ”# 设置 MACD 柱状 图 


53 for index, row in stockDataFrame .iterrows () : 


54 if (row['MACD'] >0) : # 大 于 0 则 用 红色 

5 plt.bar(row['date'], row['MACD'],width=0.5, color='red') 
56 else: # 小 于 等 于 0 则 用 绿色 

与 又 plt.bar(row['date'], row['MACD'],width=0.5, color='green') 


58 ”# 设置 x 轴 坐标 的 标签 和 旋转 角度 

59 major index=stockDataFrame.index[stockDataFrame.index%10==0] 
60 major xtics=stockDataFrame['date'] [stockDataFrame.index%10==0] 
61 plt.xticks (major index,major xtics) 

62 plt.setp(plt.gca().get xticklabels(), rotation=30) 

63 ”# 带 网 格 线 ， 且 设置 了 网 格 样式 

64 plt.grid(linestyle='-.') 

65 plt.title("600895 张江 高 科 的 MACD 图 ") 

66 plt.rcParams['axes.unicode minus'] = False 

67 plt.rcParams['font.sans-serif']=['SimHei'] 

68 plt.show() 


在 第 49 和 第 50 行 中 通过 调用 plot 方法 ， 以 折线 的 形式 绘制 出 DEA 和 DIF 两 根 线 ， 在 第 51 
行 中 设置 了 图 例 。 在 第 53 行 到 第 57 行 的 for 循环 中 ， 以 柱状 图 的 形式 依次 绘制 了 每 天 的 MACD 
值 的 柱状 线 , 这 里 用 第 54 行 和 第 56 行 的 if...else 语句 进行 区 分 , 如 果 大 于 0, 则 MACD 柱 是 红色 ， 
反之 是 绿色 。 

从 第 59 行 到 第 61 行 的 程序 语句 设置 了 x 轴 的 标签 ， 如 果 显示 每 天 的 日 期 ， 那 么 x 轴 上 的 文 
字 会 过 于 密集 , 所 以 在 第 59 行 和 第 60 行进 行 相应 的 处 理 , 只 显示 stockDataFrame.index%10==0( 即 
索引 值 是 10 的 倍数 ) 的 日 期 。 

在 第 62 行 设置 了 x 轴 文 字 的 旋转 角度 ， 在 第 64 行 设置 了 网 格 的 式样 ， 在 第 65 行 设置 了 标题 
文字 ， 最 后 在 第 68 行 通过 调用 show 方法 绘制 了 整个 图 形 。 

如 果 按 8.2 节 的 内 容 已 经 往 stock_600895 数据 表 中 插入 了 股票 “张江 高 科 ” 指 定时 间 范 围 内 的 
股票 交易 数据 ， 则 可 以 看 到 如 图 8-8 所 示 的 图 形 。 请 注意 ， 如 果 不 编写 第 66 行 的 程序 语句 ， 那 么 
y 轴 标 签 值 里 的 负 号 就 不 会 显示 ， 读 者 可 以 把 这 条 语句 注释 掉 后 ， 再 运行 一 下 ， 看 看 结果 如 何 。 

如 果 打 开 “ 中 国 银河 证 券 双 子 星 ”软件 〈 其 他 股票 交易 软件 也 一 样 ) ， 用 该 软件 打开 股票 “ 张 
江 高 科 ”2018 年 9 月 到 2019 年 5 月 的 MACD 走势 图 ， 如 图 8-8 所 示 ， 会 发 现 由 股票 交易 软件 绘 
制 出 的 MACD 走势 图 和 本 节 中 用 Python 绘制 出 的 如 图 8-9 所 示 的 MACD 走势 图 基本 一 致 。 
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600895 张 江 高 科 的 MACD 图 
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图 8-8 股票 “张江 高 科 ”MACD 走势 图 


日 战 张江 高 科 MA5: 9.10 MA 


图 8-9 由 股票 交易 软件 绘制 出 的 股票 “张江 高 科 ” 的 MACD 走势 图 


至 此 ， 我 们 实现 了 计算 并 绘制 MACD 指标 线 的 功能 ， 通 过 8.2 节 的 学 习 


， 读 者 应 该 掌握 了 如 


何 获得 指定 股票 在 指定 时 间 段 内 的 交易 数据 , 而 后 可 以 稍微 改写 上 述 的 范例 程序 , 绘制 出 其 他 股票 


在 指定 时 间 范 围 内 的 MACD 走势 图 。 


8.3.3 ”关于 数据 误差 的 说 明 


在 表 8-2 中 ， 对 比 了 若干 交易 日 中 程序 计算 出 的 MACD 相关 指标 和 “中 


国 银河 证 券 双 子 星 ” 


软件 计算 出 的 MACD 相关 指标 。 从 中 可 以 发 现 , 通过 DrawMACD.py 范例 程序 计算 出 的 MACD 相 


关 指 标 和 由 股票 交易 软件 得 出 的 MACD 相关 指标 值 之 间 有 细微 的 差别 。 
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表 8-2 MACD 数据 对 比 表 (精确 到 小 数 点 后 3 位 ) 


MACD |MACD | DIF DIF DEA( 软 | DEA( 程 
(软件 ) | 程序) (软件 ) | 程序 ) | 件 ) 序 ) 
20190411 | -0.908 | -0.913 0529 “| 0539 “| 0.983 0.996 


交易 日 


20190415 | -0.930 -0.935 0.287 0.296 0.752 0.763 


20190418 | -0.749 -0.754 0.079 0.086 0.453 0.463 


20180903 | 0.047 0.000 -0.207 0.000 -0.230 0.000 


20180904 | -0.056 0.010 -0.195 0.006 -0.223 0.001 


20180905 | 0.047 0.000 -0.194 0.002 -0.217 0.001 


其 原因 是 ， 股 票 交 易 软件 开始 计算 MACD 指标 的 起 始 日 是 该 股票 的 上 市 之 日 ， 而 
DrawMACD.py 范例 程序 中 计算 的 起 始 日 是 20180903, 在 这 一 天 里 , 范例 程序 中 给 相关 指标 赋予 的 
值 仅仅 是 当日 的 指标 (因为 没 取 之 前 的 交易 数据 )， 而 股票 交易 软件 计算 这 一 天 的 相关 指标 是 基于 
之 前 交易 日 的 数据 计算 而 来 的 ， 于 是 就 产生 了 如 表 8-2 所 示 的 误差 。 

通过 进一步 的 对 比 可 以 发 现 ， 离 20180903 越 近 的 日 期 ， 两 者 的 误差 越 明显 ， 因 为 DIF 的 周期 
是 9 日 ， 而 慢 速 EMA 的 周期 是 26 日 。 在 表 8-2 中 ， 离 开 起 始 日 有 半年 多 的 时 间 ， 所 以 误差 范围 
就 在 0.01 左右 。 

在 后 续 章 节 的 KDJ 等 指标 的 分 析 过 程 中 ， 读 者 也 将 看 到 类 似 的 误差 情况 。 本 书 对 这 些 指标 进 
行 分 析 的 目的 并 不 是 用 于 推荐 股票 ， 分 析 股 票 策略 的 动机 也 仅仅 是 通过 计算 进一步 示范 Python 相 
关 对 象 的 用 法 ， 所 以 也 无 意 修正 误差 ， 毕 况 本 书 的 精髓 在 于 借助 股票 范例 程序 来 演示 Python 编程 
中 常见 的 用 法 。 而 一 些 股票 交易 软件 的 相关 指标 已 经 做 得 非常 完善 , 如 果 读 者 真 的 有 投资 选 股 的 需 
要 ， 直 接 参考 其 中 的 各 种 指标 即 可 。 


8.3.4 MACD 与 K 线 均 线 的 整合 效果 图 


MACD 是 趋势 类 指标 ， 如 果 把 它 与 K 线 和 均线 整合 到 一 起 的 话 ， 就 能 更 好 地 看 出 股票 走势 的 
“趋势 性 ”。 在 下 面 的 DrawKwithMACD.py 范例 程序 中 示范 了 整合 它们 的 效果 ， 由 于 程序 代码 比 
较 长 , 因而 在 下 面 的 分 析 中 略 去 了 一 些 之 前 分 析 过 的 重复 代码 , 读者 可 以 从 本 书 提供 下 载 的 范例 程 
序 中 看 到 完整 的 代码 。 


证 # !/usr/bin/env Python 
2 # coding=utf-8 

3 import pandas as pd 

4 import matplotlib.pyplot as plt 

5 import pymysql 

6 import sys 

7 from mpl_ finance import candlestick2 ochl 

8 from matplotlib.ticker import MultipleLocator 
9 “## 计算 EMA 的 方法 ， 第 一 个 参数 是 数据 ， 第 二 个 参数 是 周期 

10 def calEMA(df, term): 

ii # 省 略 具体 实现 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
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2 
14 
有 


# 定义 计算 MACD 的 方法 
def calMRCD (df， shortTerm=12, longTerm=26, DIFTerm=9): 
# 省 略 中 间 的 计算 过 程 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 


return df 


从 第 3 行 到 第 8 行 的 程序 语句 通过 import 语句 导入 了 必要 的 依赖 包 ， 第 10 行 定义 的 calEMA 


方法 和 DrawMACD.py 范例 程序 中 的 完全 一 致 ， 所 以 就 省 略 了 该 方法 内 部 的 代码 。 第 13 行 定义 计 
算 MACD 的 calMACD 方法 和 DrawMACD.py 范例 程序 中 的 同名 方法 也 完全 一 致 ， 但 在 最 后 的 第 


15 行 , 是 通过 retum 语句 返回 整个 df 对 象 , 而 不 是 返 


加 


仅仅 包含 MACD 指标 的 相关 列 , 这 是 因为 ， 


在 后 文中 需要 股票 的 开盘 价 等 数值 来 绘制 K 线 图 。 


16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
3 
2 
33 


try: 
# 打开 数据 库 连 接 
db = pymysql.connect ("localhost","root","123456", "PythonStock" ) 
except: 
print('Error when Connecting to DB.') 
SYS .exit() 
cursor = db.cursor() 
cursor.execute("select * from stock 600895") 
cols = cursor.description # 返回 列 名 
heads = [] 
# 依次 把 每 个 cols 元 素 中 的 第 一 个 值 放 入 col 数组 
for index in cols: 
heads .append (index[0]) 
result = cursor.fetchall () 
df = pd.DataFrame (list (result)) 
df.columns=heads 
# print (calMACD (df, 12, 26, 9)) # 输出 结果 
stockDataFrame = calMACD(df, 12, 26, 9) 


从 第 16 行 到 第 33 行 的 程序 语句 把 需要 的 数据 放 入 了 stockDataFrame 这 个 DataFrame 类 型 的 


对 象 中 ， 之 后 就 可 以 根据 其 中 的 数据 画图 了 ， 这 段 程序 代码 之 前 分 析 过 ， 就 不 再 重复 讲述 了 。 


34 
35 
36 
37 


38 


39 


40 


41 


42 


43 
44 


# 开始 绘图 ， 设 置 大 小 ， 共 享 x 坐标 轴 

figure, (axPrice, axMACD) = plt.subplots(2, sharex=True, figsize=(15,8)) 

# 调用 方法 绘制 K 线 图 

candlestick2 ochl (ax = axPrice, opens=stockDataFrame["open"] .values, closes 
= stockDataFrame ["close"] .values, highs=stockDataFrame["high"] .values, lows 
= stockDataFrame["low"] .values, width=0.75, colorup='red', colordown='green') 
axPrice.set title ("600895 张江 高 科 K 线 图 和 均线 图 ") # 设置 子 图 的 标题 
stockDataFrame['close'] .rolling (window=3) .mean () .plot (ax=axPrice, 
color="red", label='3 日 均线 ') 

stockDataFrame['close'] .rolling (window=5) .mean() .plot (ax=axPrice, 
color="blue", label='5 日 均线 ') 

stockDataFrame['close'] .rolling (window=10) .mean() .plot (ax=axPrice, 
color="green", label='10 日 均线 ') 

axPrice.legend (loc='best') # 绘制 图 例 

axPrice.set_ylabel ("价格 (单位 : 元 ) ") 

axPrice.grid(linestyle='-.') # 带 网 格 线 
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从 第 34 行 到 第 44 行 的 程序 语句 绘制 了 指定 时 间 范 围 内 “张江 高 科 ” 股 票 的 K 线 图 和 均线 ， 
这 部 分 代码 和 第 7 章 drawKMAAndVol.py 范例 程序 中 实现 同类 功能 的 代码 很 相似 ， 有 差别 的 是 在 
第 35 行 ， 第 二 个 子 图 的 名 字 设 置 为 “axMACD”, 在 第 44 行 中 通过 linestyle 设置 了 网 格 线 的 样式 。 
45 开始 绘制 第 二 个 子 图 
46 stockDataFrame ['DERA'] .plot (ax=axMACD, color="red",1abel='DERA') 
47 stockDataFrame['DIF'] .plot (ax=axMACD,color="blue",label='DIF') 
48 plt.legend (loc='best') # 绘制 图 例 
49 ”# 设置 第 二 个 子 图 中 的 MacD 柱状 图 


50 for index, row in stockDataFrame .iterrows () : 


SE if (row['MACD'] >0) : # 大 于 0 则 用 红色 

52 axMACD .bar (row['date'], row['MACD'],width=0.5, color='red’' 

53 else: # 小 于 等 于 0 则 用 绿色 

54 axMRCD.bar (row['date'], row['MACD'],width=0.5, color='green') 
55 axMACD.set title ("600895 张江 高 科 MACD") # 设置 子 图 的 标题 

56 axMACD.grid(linestyle='-.') # 带 网 格 线 


57 # xmajorLocator = MultipleLocator(10) # 将 x 轴 的 主 刻度 设置 为 10 的 倍数 
58 # axMACD.xaxis.set _ major locator (xmajorLocator) 

59 major xtics=stockDataFrame['date'] [stockDataFrame.index%10==0] 

60 axMACD.set xticks (major xtics) 

61 # 旋转 x 轴 显 示 文字 的 角度 

62 for xtick in axMACD.get xticklabels(): 

63 xtick.set rotation(30) 

64 plt.rcParams['font.sans-serif']=["'SimHei'] 

65 plt.rcParams['axes.unicode minus'] = False 

66 plt.show() 


在 上 述 程序 代码 中 ， 在 axMACD 子 图 内 绘制 了 MACD 线 ， 由 于 是 在 子 图 内 绘制 ， 因 此 在 第 
46 行 和 第 47 行 绘制 DEA 和 DIF 折线 的 时 候 ， 需 要 在 参数 里 通过 “ax=axMACD” 的 形式 指定 所 在 
的 子 图 。 

在 第 59 行 和 第 60 行 中 设置 了 axMACD 子 图 中 的 x 轴 标签 ， 由 于 在 第 35 行 中 设置 了 axPrice 
和 axMACD 两 子 图 共享 x 轴 ， 因 此 K 线 和 均线 所 在 子 图 的 x 轴 刻 度 会 和 MACD 子 图 中 的 一 样 。 
因为 是 在 子 图 中 ， 所 以 需要 通过 第 62 行 和 第 63 行 的 for 循环 依次 旋转 x 轴 坐 标的 标签 文字 。 

在 这 段 代 码 中 其 实 给 出 了 两 种 设置 x 轴 标签 的 方式 。 如 果 注 释 掉 第 59 行 和 第 60 行 的 代码 ， 
并 去 掉 第 57 行 和 第 58 行 的 注释 ， 会 发 现 效果 是 相同 的 。 

需要 说 明 的 是 ， 虽 然 在 第 57 行 和 第 59 行 的 代码 中 并 没有 指定 标签 文字 ， 但 在 第 37 行 调用 
candlestick2_ochl 方法 绘制 K 线 图 时 , 会 设置 x 轴 的 标签 文字 , 所 以 依然 能 看 到 x 轴 上 日 期 的 标签 。 
运行 这 个 范例 程序 后 ， 结 果 如 图 8-10 所 示 。 
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图 8-10 K 线 、 均 线 整合 MACD 后 的 走势 图 
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8.4 验证 基于 MACD 指标 的 买卖 点 


在 本 节 中 将 讲述 股票 交易 理论 中 基于 MACD 指标 的 研判 标准 , 而 后 再 通过 Python 程序 来 验证 
一 下 ， 让 读者 从 中 再 次 熟悉 Python 相关 数据 结构 对 象 的 用 法 。 


8.4.1 MACD 指标 的 指导 意义 与 盲点 


根据 MACD 各 项 指标 的 含义 ， 可 以 通过 DIF 和 DEA 两 者 的 值 、DIF 和 DEA 指标 的 交叉 情况 
(比如 金 叉 或 死 叉 ) 以 及 BAR 柱状 图 的 长 短 与 收缩 的 情况 来 判断 当前 股票 的 趋势 。 
如 下 两 点 是 根据 DIF 和 DEA 的 数值 情况 以 及 它们 在 x 轴 上 下 的 位 置 来 确定 股票 的 买卖 策略 。 


(1) 当 DIF 和 DEA 两 者 的 值 均 大 于 0 (在 x 轴 之 上 ) 并 向 上 移动 时 ， 一 般 表示 当前 处 于 多 
头 行情 中 ， 建 议 可 以 买 入 。 反 之 ， 当 两 者 的 值 均 小 于 0 且 向 下 移动 时 ， 一 般 表 示 处 于 空头 行情 中 ， 
建议 卖 出 或 观望 。 

(2) 当 DIF 和 DEA 的 值 均 大 于 0 但 都 在 向 下 移动 时 ， 一 般 表示 为 上 涨 趋势 即将 结束 ， 建 议 
可 以 卖 出 股票 或 观望 。 同 理 ， 当 两 者 的 值 均 小 于 0， 但 在 向 上 移动 时 ， 一 般 表示 股票 将 上 涨 ， 建 议 

如 下 四 点 是 根据 DIF 和 DEA 的 交叉 情况 来 决定 买卖 策略 。 


(1) DIF 与 DEA 都 大 于 0 而 且 DIF 向 上 突破 DEA 时 ， 说 明 当 前 处 于 强势 阶段 ， 股 价 再 次 上 
涨 的 可 能 性 比较 大 ， 建 议 可 以 买 进 ， 这 就 是 所 谓 MACD 指标 黄金 交叉 ， 也 叫 金 叉 。 

(2) DIF 与 DEA 都 小 于 0， 但 此 时 DIF 向 上 突破 DEA 时 ， 表 明 股 市 虽然 当前 可 能 仍然 处 于 
跌 势 ， 但 即将 转 强 ， 建 议 可 以 开始 买 进 股票 或 者 重点 关注 ， 这 也 是 MACD 金 叉 的 一 种 形式 。 

(3) DIF 与 DEA 虽然 都 大 于 0， 但 DIF 向 下 突破 DEA 时， 这 说 明 当 前 有 可 能 从 强势 转变 成 


154 ”| “基于 股票 大 数据 分 析 的 Python 入 门 实 战 ( 视频 教学 版 ) 


弱势 ， 股 价 有 可 能 会 跌 ， 此 时 建议 看 机 会 就 卖 出 ， 这 就 是 所 谓 MACD 指标 的 死亡 交叉 ， 也 叫 死 叉 。 

(4) DIF 和 DEA 都 小 于 0， 在 这 种 情况 下 又 发 生 了 DIF 向 下 突破 DEA 的 情况 ， 这 说 明 可 能 
进入 下 一 阶段 的 弱势 中 ， 股 价 有 可 能 继续 下 跌 ， 此 时 建议 卖 出 股票 或 观望 ， 这 也 是 MACD 死 叉 的 
一 种 形式 。 


如 下 两 点 是 根据 MACD 中 BAR 柱状 图 的 情况 来 决定 买卖 策略 。 


(1) 红 柱 持续 放大 ， 这 说 明 当 前 处 于 多 头 行情 中 ， 此 时 建议 买 入 股票 ， 直 到 红 柱 无 法 再 进 一 
步 放 大 时 才 考虑 卖 出 。 相 反 ， 如 果 绿 柱 持续 放大 ， 这 说 明 当前 处 于 空头 行情 中 ， 股 价 有 可 能 继续 下 
跌 ， 此 时 观望 或 卖 出 ， 直 到 绿 柱 开始 缩小 时 才能 考虑 买 入 。 

(2) 当红 柱 逐 渐 消 失 而 绿 柱 逐 渐 出 现时 ， 这 表明 当前 的 上 涨 趋势 即将 结束 ， 有 可 能 开始 加 速 
下 跌 ， 这 时 建议 可 以 卖 出 股票 或 者 观望 。 反 之 ， 当 绿 柱 逐 渐 消失 而 红 柱 开始 出 现时 ， 这 说 明 下 跌 行 
情 即 将 或 者 已 经 结束 ， 有 可 能 开始 加 速 上 涨 ， 此 时 可 以 开始 买 入 。 


虽然 说 MACD 指标 对 趋势 的 分 析 有 一 定 的 指导 意义 ， 但 它 同时 也 存在 一 定 的 盲点 。 

比如 ， 当 没有 形成 明显 的 上 涨 或 下 跌 趋 势 时 〈 即 在 盘整 阶段 ) ，DIF 和 DEA 这 两 个 指标 会 频 
繁 地 出 现金 丸和 死 叉 的 情况 ， 这 时 由 于 没有 形成 趋势 ， 因 此 金 叉 和 死 叉 的 指导 意义 并 不 明显 。 

又 如 ，MACD 指标 是 对 趋势 而 言 的 ， 从 中 无 法 看 出 未 来 时 间 段 内 价格 上 涨 和 下 跌 的 幅度 。 比 
如 在 图 8-11 中 ， 股 票 “张江 高 科 ” 在 价格 高 位 时 ，DIF 的 指标 在 2 左右 ， 但 有 些 股票 在 高 位 时 ， 
DIF 的 指标 甚至 会 超过 5。 

也 就 是 说 , 无 法 根据 DIF 和 DEA 数值 的 大 小 来 判断 股价 会 不 会 进一步 涨 或 进一步 跌 。 有 时 看 
似 DIF 和 DEA 到 达 一 个 高 位 ， 但 如 果 当 前 上 涨 趋势 强劲 ， 股 价 会 继续 上 涨 ， 同 时 这 两 个 指标 会 进 
一 步 上 升 ， 反 之 亦 然 。 

因此 ， 在 实际 使 用 中 ， 投 资 者 可 以 用 MACD 指标 结合 其 他 技术 指标 ， 比 如 之 前 提 到 的 均线 ， 
从 而 能 对 买卖 信号 进行 多 重 确认 。 


8.4.2 ”验证 基于 柱状 图 和 金 叉 的 买点 


在 8.4.1 小 节 介绍 了 基于 柱状 图 和 MACD 金 叉 的 买卖 策略 ， 在 CalBuyPointByMACD.py 范例 
程序 中 将 根据 如 下 原则 来 验证 买点 : DIF 向 上 突破 DEA (出 现金 叉 ) ， 且 柱状 图 在 x 轴 上 方 〈 即 
当前 是 红 柱状 态 ) 。 

在 这 个 范例 程序 中 ， 用 的 是 股票 “金石 资源 〈 代 码 为 603505) 从 2018 年 9 月 到 2019 年 5 月 
的 交易 数据 ,这 部 分 数据 存放 在 8.2 节 介绍 过 的 stock_603505 数据 表 中 ,如 果 在 数据 表 中 没有 现成 
数据 ， 那 么 在 运行 InsertDataFromYahoo.py 范例 程序 之 后 即 可 得 到 。CalBuyPointByMACD.py 范例 
程序 的 程序 代码 如 下 。 
1 # !/usr/bin/env Python 
# coding=utf-8 
有 import pandas as pd 
4 import pymysql 
A import sys 
6 ”# 第 一 个 参数 是 数据 ， 第 二 个 参数 是 周期 
加 def calEMA(df, term): 
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8 # 省 略 方法 内 的 代码 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 

9 ”# 定义 计算 MACD 的 方法 

10 def calMACD(df, shortTerm=12, longTerm=26, DIFTerm=9): 

J # 省 略 中 间 计 算 过 程 的 代码 ， 最 后 返回 的 是 df， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
1 return df 


上 述 代码 的 calEMA 和 calMACD 方法 和 8.3.4 小 节 的 范例 程序 中 的 代码 完全 一 致 ， 所 以 就 不 


再 重复 讲述 了 。 

13 def getMACDByCode (code) : 

14 BE 

15 # 打开 数据 库 连接 

16 db = pymysql.connect ("localhost", "root","123456", "pythonstock" ) 
Eh except: 

18 Print('Error when Connecting to DB.') 
19 sys.exit () 

20 cursor = db.cursor() 

2 cursor.execute('select * from stock '+code) 
22 cols = cursor.description  # 返回 列 名 

23 heads = [] 

24 # 依次 把 每 个 col s 元 素 中 的 第 一 个 值 放 入 col 数组 

25 for index in cols: 

26 heads .append (index[0]) 

27 result = cursor.fetchall() 

28 df = pd.DataFrame (list (result)) 

29 df.columns=heads 

30 stockDataFrame = calMACD(df, 12, 26, 9) 

2 return stockDataFrame 


第 13 行 开始 的 getMACDByCode 方 法 中 包含 了 从 数据 表 中 获取 的 股票 交易 数据 并 返回 MACD 
指标 的 代码 ， 这 部 分 程序 代码 与 之 前 DrawKwithMACD.py 范例 程序 中 的 程序 也 非常 相似 , 只 不 过 
在 第 21 行 中 是 根据 股票 代码 来 动态 地 拼接 select 语句 。 该 方法 在 第 31 行 中 返回 包含 MACD 指标 
的 stockDataFrame 对 象 。 

32 # print (getMACDByCode('603505')) ，# 可 去 除 这 条 语句 的 注解 以 确认 数据 
33 stockDf = getMACDByCode('603505') 

34 cnt=0 

35 while cnt<=len(stockDf)-1: 


36 if (cnt>=30): # 前 几 天 有 误差 ， 从 第 30 天 算 起 
二 9 Br 


38 # 规则 1: 这 天 DIF 值 上 穿 DER 

入 3 if stockDf.iloc[cnt]["DIF'"]>stockDft.iloc[cnt]["DERA'] and 
stockDf.iloc[cnt-1] ['DIF']<stockDf.iloc[cnt-1] ['DERA'] : 

40 # 规 则 2: 出 现 红 柱 ， 即 MACD 值 大 于 0 

41 if stockDf.iloc[cnt] ['MACD']>0: 

42 Print ("Buy Point by MACD on:" + stockDf.iloc[cnt]['date']) 

43 except: 

44 pass 

45 cnt=cnt+1 


如 果 去 掉 第 32 行 打印 语句 的 注释 ， 执 行 后 就 能 确认 数据 。 在 第 35 行 到 第 45 行 的 while 循环 
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中 ， 依 次 遍历 了 每 个 交易 
程序 中 通过 第 36 行 的 fi 


在 第 39 行 的 让 条 件 语句 中 制定 了 第 一 
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日 的 数据 。 之 前 在 8.3.3 小 节 提 到 过 有 数据 计算 的 误差 ， 所 以 在 这 个 范例 
得 句 排除 了 刚 开 始 29 天 的 数据 ， 从 第 30 天 算 起 。 
个 规则 ,前 一 个 交易 日 的 DIF 小 于 DEA, 而 且 当天 DIF 


大 于 DEA， 即 出 现 上 穿 金 叉 的 现象 。 在 第 41 行 的 让 条 件 语句 中 制定 了 第 二 个 规则 ， 即 出 现金 叉 的 


当日 ，MACD 指标 需要 大 于 0， 即 当前 BAR 柱 是 红 柱状 态 。 


下 输出 的 买点 。 


Buy Point by MACD 
Buy Point by MACD 
Buy Point by MACD 
Buy Point by MACD 
Buy Point by MACD 


运行 这 个 范例 程序 之 后 ， 就 能 看 到 如 
on:2018-10-31 
on:2019-01-09 
on:2019-03-18 
on:2019-04-04 
on:2019-04-19 


下 面 改 写 一 下 8.3.4 小 节 的 DrawKwithMACD.py 范例 程序 ， 把 股票 代码 改 成 603505， 把 股票 
运行 后 即 可 看 到 如 图 8-11 所 示 的 结果 图 。 
金石 资源 K 线 图 和 均线 图 


名 称 改 为 “金石 资源 ”， 


金石 资源 MACD 


00 


10.51 


ph fa 


和 E “=p pe | 
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图 8-11 金石 资源 K 线 、 均 线 整合 MACD 的 走势 图 


根据 图 8-11 中 的 价格 走势 ， 在 表 8-3 中 列 出 了 各 买点 的 确认 情况 。 


表 8-3 基于 MACD 得 到 的 买点 情况 确认 表 


买点 对 买点 的 分 析 正确 性 
2018-10-31 该 日 出 现 DIF 金 叉 ， 且 Bar 已 经 在 红 柱状 态 ， 后 市 有 涨 正确 
| 2019-01-09 ”| 该 日 出 现 DIF 金丸 ， 且 Bar 柱 开始 逐渐 变 红 ， 后 市 有 涨 。 | 正确 
oe | 该 日 虽然 出 现金 又 ，Bar 柱 也 开始 变 红 ， 但 之 后 几 天 Bar 交 | 2 
蔡 出 现 红 柱 和 绿 柱 情况 ， 后 市 在 下 跌 后 ， 出 现 上 涨 情况 
该 日 在 出 现金 又 的 同时 ，Bar 柱 由 绿 转 红 。 但 之 后 若干 交易 
?0190404 | 日后 出 现 死 又 ， 且 Bar 柱 又 转 绿 ， 后 市 下 跌 ig 
2019-04-19 出 现金 又 ， 且 Bar 柱 由 绿 柱 一 下 子 变 很 长 ， 后 市 有 涨 正确 
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根据 这 个 范例 程序 的 运行 结果 ， 可 以 得 到 的 结论 是 : 通过 MACD 指标 的 确 能 算出 买点 ， 但 之 
前 也 说 过 ，MACD 有 盲点 ， 在 盘整 阶段 ， 趋 势 没 有 形成 时 ， 此 时 金 叉 的 指导 意义 就 不 是 很 明显 ， 
甚至 是 错误 的 。 


8.4.3 ”验证 基于 柱状 图 和 死 叉 的 卖点 


参考 MACD 指标 ， 与 8.4.2 小 节 描述 的 情况 相反 ， 如 果 出 现 如 下 情况 ， 则 可 以 卖 出 股票 : DIF 
向 下 突破 DEA “出现 死 叉 ) ， 且 柱状 图 向 下 运动 〈 红 柱 缩小 或 绿 柱 变 长 ) 。 下 面 通 过 股票 “ 士 兰 
微 ” (代码 为 600460) 从 2018 年 9 月 到 2019 年 5 月 的 交易 数据 来 验证 卖点 。 

先 来 做 如 下 的 准备 工作 :在 MySQL 的 pythonStock 数据 库 中 创建 stock_600460 数据 表 , 在 8.2.2 
小 节 介 绍 的 InsertDataFromYahoo.py 范例 程序 中 ， 把 股票 代码 改 为 600460， 运 行 后 即 可 在 
stock_600460 数据 表 中 看 到 指定 时 间 范 围 内 的 交易 数据 。 

验证 MACD 指标 卖点 的 CalSellPointByMACD.py 范例 程序 与 之 前 CalBuyPointByMACD.py 范 
例 程序 很 相似 ， 下 面 只 分 析 不 同 的 程序 代码 部 分 。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 import pandas as pd 

4 import pymysql 

本 import sys 

6 ”# calEMA 方法 中 的 代码 没有 变 

def calEMA(df, term): 

8 # 省 略 方法 内 的 程序 代码 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
9 “## 定义 计算 MACD 的 方法 内 的 程序 代码 也 没有 变 

10 def calMACD(df, shortTerm=12, longTerm=26, DIFTerm=9): 
"rl # 省 略 方法 内 的 程序 代码 ， 请 参考 本 书 提 供 下 载 的 完整 范例 程序 
12 def getMACDByCode (code) : 

13 # 和 CalBuyPointByMACD.py 范例 程序 中 的 程序 代码 一 致 

14 stockDf = getMRCDBYCode('6004607) 

15 cnt=0 

16 while cnt<=len(stockDf)-1: 

7 if (cnt>=30): # 前 几 天 有 误差 ， 从 第 30 天 算 起 


i try: 

19 # 规则 1: 这 天 DIF 值 下 穿 DER 

20 if stockDf.iloc[cnt] ['DIF']<stockDf.iloc[cnt] ['DEA'] and 
stockDf.iloc[cnt-1] ['DIF']>stockDf.iloc[cnt-1] ['DEA']: 

2 # 规则 2: Bar 柱 是 否 向 下 运动 

22 if stockDf.iloc[cnt] ['MACD']<stockDf.iloc[cnt-1] ['MACD']: 

23 Print ("Sell Point by MACD on:" + stockDf.iloc[cnt]['date']) 

24 except: 

25 pass 

26 cnt=cnt+1 


上 述 代 码 中 的 calEMA、calMACD 和 getMACDByCode 三 个 方法 和 CalBuyPointByMACD.py 
范例 程序 中 的 代码 完全 一 致 ， 所 以 本 节 仅仅 给 出 了 这 些 方法 的 定义 ， 不 再 重复 讲述 了 。 
在 第 14 行 中 通过 调用 getMACDByCode 方法 ， 获 取 了 600460 (〈 士 兰 微 ) 的 交易 数据 ， 其 中 包 
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含 了 MACD 指标 数据 。 在 第 16 行 到 第 26 行 的 while 循环 中 通过 遍历 stockDf 对 象 ， 计 算 卖 点 。 

具体 的 步骤 是 ， 通 过 第 17 行 的 让 条 件 语句 排除 了 误差 比较 大 的 数据 ， 随 后 通过 第 20 行 的 认 
语句 判断 当天 是 否 出 现 了 DIF 死 叉 的 情况 ， 即 前 一 个 交易 日 的 DIF 比 DEA 大 , 但 当前 交易 日 DIF 
比 DEA 小 。 当 满足 这 个 条 件 时 ， 再 通过 第 22 行 的 让 语句 判断 当天 的 Bar 柱 数值 是 否 小 于 前 一 天 
的 ， 即 判断 Bar 柱 是 否 在 向 下 运动 。 当 满足 这 两 个 条 件 时 ， 通 过 第 23 行 的 代码 输出 建议 卖 出 股票 
的 日 期 。 运 行 这 个 范例 程序 代码 后 ， 可 看 到 如 下 输出 的 卖点 。 

Sell Point by MACD on:2018-10-11 

Sell Point by MACD on:2018-11-29 

Sell Point by MACD on:2018-12-06 

Sell Point by MACD on:2019-02-28 

Sell Point by MACD on:2019-04-04 

前 文 提 到 的 DrawKwithMACD.py 范例 程序 ， 把 股票 代码 改 为 600460， 把 股票 名 称 改 成 “ 士 兰 
微 ”， 运 行 后 即 可 看 到 如 图 8-12 所 示 的 结果 图 。 


士 兰 微 K 线 图 和 均线 图 


2.01— 3 
一 5B 二 
一 一 108 均 线 


士 兰 微 MACD 
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图 8-12 股票 “ 士 兰 微 ”的 K 线 、 均 线 整合 MACD 的 走势 图 
再 根据 图 8-12 中 的 价格 走势 ， 在 表 8-4 中 列 出 了 各 卖点 的 确认 情况 。 
表 8-4 基于 MACD 得 到 的 卖点 情况 确认 表 


卖点 对 卖点 的 分 析 正确 性 
1. 该 日 出 现 DIF 死 叉 ， 且 DIF 和 DEA 均 在 x 轴 下 方 ，Bar 
由 红 转 绿 ， 且 绿 柱 持续 扩大 


200810 1 | > 虽然 能 验证 该 点 附近 处 于 弱势 ， 但 由 于 此 点 已 经 处 于 弱 | 不 胡 
势 ， 所 以 后 市 价位 跌幅 不 大 
2018.11.29 1. 在 DIF 和 DEA 上 行 过 程 中 出 现 死 叉 


2. Bar 柱 由 红 转 绿 ， 后 市 股价 有 一 定 幅度 的 下 跌 

在 11 月 29 日 的 卖点 基础 上 ， 再 次 出 现 死 叉 , 且 Bar 柱 没有 
2018-12-06 向 上 运动 的 趋势 ， 所 以 进一步 确认 了 弱势 行情 , 果然 后 市 股 | 正确 
价 有 一 定 幅度 的 下 跌 
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( 续 表 ) 
卖点 对 卖点 的 分 析 正确 性 
1. 虽然 出 现 死 叉 ， 但 前 后 几 天 DIF 和 DEA 均 在 向 上 运动 。 
这 说 明 强 势 并 没有 结束 不 正确 


2. Bar 柱 虽 然 变 绿 ， 但 变 绿 的 幅度 非常 小 

3. 后 市 价格 不 是 下 跌 ， 而 是 上 涨 了 

1. DIF 和 DEA 在 x 轴 上 方 出 现 死 叉 ， 说 明 强势 行情 有 可 能 
即将 结束 

2019-04-04 2. Bar 柱 由 红 开 始 转 绿 正确 
3. 后 市 价位 出 现 一 波 短暂 反弹 ， 这 可 以 理解 成 强势 的 结束 ， 
之 后 出 现下 跌 ， 且 下 跌幅 度 不 小 


从 上 述 的 验证 结果 可 知 ， 从 MACD 指标 中 能 看 出 股价 发 展 的 趋势 ， 当 从 强势 开始 转 弱 时 ， 如 
果 没 有 其 他 利好 消息 ， 可 以 考虑 观望 或 适当 卖 出 股票 。 

在 通过 MACD 指标 确认 趋势 时 ， 应 当 从 DIF 和 DEA 的 数值 、 运 动 趋势 〈 即 金 叉 或 死 叉 的 情 
况 ) 和 Bar 柱 的 运动 趋势 等 方面 综合 评判 ， 而 不 能 简单 割裂 地 通过 单个 因素 来 考虑 。 
并 且 ， 影 响 股价 的 因素 非常 多 ， 在 选 股 时 ， 应 当 从 资金 面 、 消 息 面 和 指标 的 技术 面 等 因素 综 
合 考虑 ， 哪 怕 在 指标 的 技术 面 ， 也 应 当 结合 多 项 技术 指标 综合 考虑 。 如 前 文 所 述 ， 单 个 指标 难免 出 
现 盲点 ， 当 遇 到 盲点 时 就 有 可 能 出 现 风 险 而 误 判 。 


8.5 本 章 小 结 


在 本 章 的 开始 部 分 讲述 了 通过 PyMySQL 库 操作 数据 库 的 一 般 做 法 , 包括 如 何 准备 MySQL 环 
境 ， 如 何 安装 PyMySQL 库 ， 如 何 执行 增删 改 查 的 SQL 语句 。 在 讲述 完 这 些 准 备 知识 之 后 ， 接 着 
讲述 了 把 从 网 站 怜 取 的 股票 交易 数据 ， 通 过 调用 PyMySQL 库 中 的 方法 放 入 了 MySQL 对 应 的 数据 
表 中 。 

本 章 讲述 的 股票 知识 与 MACD 指标 有 关 ， 根 据 MACD 指标 可 以 看 到 市 场 的 趋势 ， 随 后 使 用 
Matplotlib 库 来 绘制 MACD 指标 线 , 不 过 与 之 前 几 章 的 范例 程序 的 差别 之 处 是 , 本 章 的 范例 程序 是 
从 数据 库 的 数据 表 中 获得 股票 的 交易 数据 。 

与 第 7 章 一 样 , 在 本 章 中 也 用 Python 语言 程序 来 验证 基于 MACD 的 买卖 点 , 通过 本 章 的 学 习 ， 
相信 读者 不 仅 可 以 进一步 深化 对 股票 趋势 分 析 的 了 解 , 还 能 通过 基于 股票 的 范例 程序 , 进一步 了 解 
Python 中 异常 处 理 、 数 据 结构 和 绘图 相关 方法 的 用 法 。 


第 9 章 
以 KDJ 范例 程序 学 习 GUI 编程 


GUI 是 Graphical User Interface 的 英文 缩写 ， 其 意 为 图 形 用 户 界面 ， 支 持 Python 语言 的 GUI 
库 是 Tkinter。 在 用 Tkinter 开发 出 来 的 用 户 操作 界面 中 ,用户 可 以 通过 键盘 和 鼠标 等 输入 设备 ， 操 
作 屏 幕 上 的 文本 框 或 命令 框 等 控件 来 完成 一 些 任务 。 

之 前 章节 的 范例 程序 中 没有 导入 GUL, 是 在 代码 中 以 静态 的 方式 设置 要 绘制 股票 指标 的 参数 ， 
如 果 要 更 改 显示 的 股票 代码 或 日 期 范围 ， 就 要 修改 Python 范例 程序 后 再 运行 。 在 本 章 中 ， 在 绘制 
KDJ 指标 时 ， 由 于 导入 了 Tkinter 库 ， 因 此 就 能 在 界面 上 实现 动态 交互 的 效果 。 


9.1 Tkinter 的 常用 控件 


Python 提供 了 多 个 图 形 开发 界面 的 库 , 本 书 用 的 是 Tkinter 库 。 请 注意 , 在 Python 3.x 版 本 中 ， 
库 名 首 字 母 是 小 写 的 t, 这 个 库 已 经 内 置 到 Python 的 安装 包 中 , 所 以 无 需 额外 安装 即 可 直接 使 用 。 
再 次 说 明 一 下 : Tkinter 的 正式 库 名 为 tkinter， 在 程序 中 用 import 导入 这 个 库 时 ,一 定 要 用 tkinter， 
不 过 在 本 书 的 行文 中 ， 如 果 单 独 指 代 这 个 库 时 依然 用 Tkinter， 即 第 一 个 字母 大 写 。 

本 节 将 通过 范例 程序 来 示范 标签 、 文 本 框 、 命 令 框 、 下 拉 框 、 单 选 框 和 复 选 框 等 Tkinter 常用 
控件 的 用 法 。 


9.1.1 ”实现 带 标 签 、 文 本 框 和 按钮 的 GUI 界面 


下 面 通过 一 个 简单 的 GUI 界面 来 介绍 Tkinter 库 的 基本 用 法 ， 在 其 中 包含 了 标签 (Label) 、 
文本 框 (Entry) 和 按钮 (Button) 控件 ， 范 例 程序 tkinterStart.py 的 具体 代码 如 下 。 
# !/usr/bin/env python 
入 # coding=utf-8 
| import tkinter 
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4 import tkinter.messagebox 

和 loginWin = tkinter.Tk() 

6 loginWin.geometry('220x120')  # 设置 大 小 

7 ”loginWin.title(' 登 录 窗 口 ') # 设置 窗口 标题 

8 ”# 放置 两 个 Label 标签 

9 tkinter.Label (loginWin, text=' 用 户 名 : ') -Place (x=10,y=20) 

10 tkinter.Label (loginWin, text=' 密 码 : ') .place (x=10,y=50) 

11 userVal = tkinter.StringVar() 

12 pwdVal = tkinter.StringVar() 

13 # Entry 是 用 来 接受 字符 串 的 控件 

14 userEntry = tkinter.Entry(loginWin,textvariable=userVal) 

15 userEntry.Place (x=65,y=20) 

16 pwdEntry = tkinter.Entry(loginWin,textvariable=pwdVal,show='*') # 用 * 号 代替 输 
A 

17 pwdEntry.place (x=65,y=50) 


18 def check(): # 登录 按钮 的 处 理 函数 〈 即 定义 单 击 登录 按钮 时 触发 的 方法 ) 
19 userName=userVal .get () 

20 pwd=pwdVal .get () 

安 币 print( ! 用 户 名 : '+ userName) 

22 Print(' 密 码 : '+pwd) 

23 if(userName=='Python' and pwd =='kdj') : 

24 tkinter.messagebox.showinfo(' 提 示 '，' 登 录 成 功 ') 

25 else: 

26 tkinter.messagebox.showinfo(' 提 示 ',' 登录 失败 ') 


27 tkinter.Button(loginWin,text=' 登 录 

',width=12, command=check) .Place (x=10, y=85) 

28 tkinter.Button(loginWin,text=' 退 出 

',width=12,command=loginWin.quit) .Place (x=120, y=85) 
29 tkinter.mainloop() 

在 第 3 行 导入 了 Tkinter 库 , 在 第 4 行 导 入 了 Tkinter 中 的 Messagebox 库 , 这 样 就 调用 到 对 话 
框 的 功能 。 注意 : 程序 语句 中 导入 库 时 要 使 用 库 的 原名 , tkinter 和 messagebox (第 一 个 字母 小 写 ) 。 

在 第 5 行 中 创建 了 一 个 窗口 ， 并 通过 第 6 行 和 第 7 行 的 程序 语句 设置 了 窗口 的 大 小 和 标题 。 
在 第 9 行 和 第 10 行 中 ， 创 建 了 两 个 tkinter.Label 类 型 的 标签 对 象 ， 创 建 时 第 一 个 参数 loginWin 表 
示 该 标签 放 在 哪个 窗口 内 ， 第 二 个 参数 text 表示 标签 的 文本 。 在 创建 时 ， 是 通过 调用 place 方法 ， 
指定 该 标签 在 窗口 内 的 位 置 。 

在 第 11 行 和 第 12 行 中 ， 定 义 了 两 个 tkinter.StringVar0 类 型 的 对 象 ， 用 来 在 第 14 行 和 第 16 
行 中 接收 两 个 文本 框 内 的 输入 内 容 。 在 定义 这 两 个 tkinter.Entry 类 型 的 文本 框 时 , 第 一 个 参数 同样 
是 指定 该 文本 框 显 示 在 哪个 窗口 内 ， 第 二 个 参数 textvariable 则 指定 输入 的 内 容 放 在 哪个 对 象 中 。 
请 注意 在 第 16 行 的 Entry 文本 框 内 ， 由 于 接收 的 是 密码 ， 因 此 还 需要 用 第 三 个 参数 “show=*” 
来 指定 输入 的 内 容 用 * 〈 星 号 ) 代 蔡 。 

在 第 27 行 和 第 28 行 中 , 定义 了 两 个 tkinter Button 类 型 的 命令 按钮 , 在 第 27 行 的 程序 语句 中 ， 
是 用 command=check 的 形式 指定 了 单 击 该 命令 按钮 后 ， 会 触发 从 第 18 行 到 第 26 行 定义 的 check 
方法 。 

在 第 28 行 定 义 的 “退出 ”命令 按钮 中 , 同样 是 通过 command 指定 了 单 击 该 按钮 后 会 触发 quit 

〈 即 退出 窗口 ) 的 操作 。 在 check 方法 中 ， 是 通过 第 23 行 和 第 25 行 的 让 .else 语句 ， 实 现 了 用 户 
名 和 密码 的 登录 验证 操作 ， 如 果 通 过 验证 ， 则 弹出 第 24 行 的 对 话 框 ， 否 则 弹出 第 26 行 的 对 话 框 。 
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最 后 请 注意 , 通过 Tkinter 实现 GUI 的 时 候 , 一 定 要 编写 如 第 29 行 所 示 的 mainloop 方法 开启 
一 个 主 循环 ， 在 这 个 循环 中 会 监听 鼠标 、 键 盘 等 操作 的 事件 ， 一 旦 有 事件 发 生 ， 则 会 触发 相应 的 
方法 ， 比 如 在 这 个 范例 程序 中 单 击 “ 登 录 ” 按 钮 会 触发 check 方法 ， 如 果 不 加 mainloop 方法 的 话 ， 
则 无 法 显示 主 窗口 。 

运行 这 个 范例 程序 后 ， 即 可 看 到 如 图 9-1 所 示 的 GUI 界面， 在 其 中 可 以 看 到 在 范例 程序 中 通 
过 代码 所 设置 的 各 个 控件 。 并 且 ， 在 输入 用 户 名 为 : python， 密 码 为 : kdj 之 后 ， 再 单 击 “ 登 录 ” 
按钮 ， 就 会 看 到 显示 “登录 成 功 ”的 对 话 框 。 如 果 是 输入 其 他 内 容 再 单 击 “登录 ”按钮 ， 则 会 显 
示 出 “登录 失败 ”的 对 话 框 。 如 果 在 登录 窗口 单 击 “ 退 出 ”按钮 ， 则 会 退出 登录 窗口 。 


用 户 名 : python 


密码 : + 
登录 退出 


图 9-1 简单 的 用 户 图 形 界面 《GUI) 效果 图 


9.1.2 ”实现 下 拉 框 控件 


在 下 面 的 tkinterWithComboBox.py 范例 程序 中 ， 除 了 将 演示 下 拉 列 表 框 控件 的 用 法 之 外 ， 还 
将 示范 如 何在 文本 框 中 设置 值 。 


# !/usr/bin/env Python 

# coding=utf-8 

import tkinter as tk 

from tkinter import ttk 

win = tk.Tk() 

win.title ("下 拉 框 ") # 添加 标题 

tk.Label (win，text=" 选 择 编程 语言 ") .grid (column=0，row=0)  # 添加 标签 

# 创建 下 拉 框 

9 ComboboxVal = tk.StringVar() 

10 combobox = ttk.Combobox (win， width=12, textvariable=comboboxVal) 

11 combobox['values'] = ('Python'，'Java'，'.NET','go')  # 设置 下 拉 列 表 框 的 值 

12 combobox.grid(column=1，row=0) # 设置 其 在 界面 中 出 现 的 位 置 ，column 代表 列 ，row 代表 
全 

13 combobox.current (0) # 设置 下 拉 列 表 框 的 默认 值 

14 ”# 清空 并 插入 文本 框 的 内 容 

15 def handle(): 


o vawm 必 wwN PP 


16 text .delete (0,tk.END) 
和 text .insert (0,combobox.get ()) 
18 ”# 创建 按钮 


19 button = tk.Button (win，text=" 选 择 "，width=12, command=handle) 
20 button.grid(column=1, row=1) 

21 # 创建 文本 框 

22 val = tk.StringVar () 

23 text = tk.Entry(win, width=12，textvariable=val) # 创建 文本 框 
24 text.grid(column=0, row=1) 
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25 text.focus () # 默认 设置 焦点 〈 光 标 ) 在 文本 框 中 
26 win.mainloop () # 开启 主 循环 以 监听 事件 

第 7 行程 序 语 句 创 建 了 一 个 Label 标签 控件 , 通过 grid(column=0, row=0) 的 方式 指定 了 该 控件 
的 位 置 是 在 窗口 内 的 第 0 行 第 0 列 。 

在 第 9 行 中 定义 了 用 来 接收 下 拉 列 表 框 选中 内 容 的 comboboxVal 对 象 ， 并 在 第 10 行 中 定义 
了 名 为 combobox 的 下 拉 列 表 框 ， 在 定义 时 ， 把 内 容 和 comboboxVal 绑 定 到 一 起 。 在 第 11 行 中 定 
义 了 下 拉 框 列表 中 的 值 ， 并 在 第 13 行 中 指定 了 默认 值 。 在 第 12 行 中 ， 同 样 是 通过 调用 grid 方法 
来 设置 下 拉 列 表 框 的 位 置 ， 位 置 是 在 窗口 内 的 第 0 行 第 1 列 ， 即 在 标签 控件 的 右边 。 

在 第 18 行 和 第 19 行 中 定义 了 按钮 控件 ， 按 钮 控件 显示 的 文本 内 容 为 “选择 ”， 位 置 是 在 窗 
口内 的 第 1 行 第 0 列 ， 按 钮 对 应 的 处 理 方法 是 第 15 行 定 义 的 handle 方法 。 在 这 个 方法 中 ， 先 是 通 
过 调用 第 16 行 的 delete 方法 来 清空 text 文本 框 , 再 通过 调用 第 17 行 的 insert 方法 把 下 拉 列 表 框 选 
中 的 内 容 设置 到 text 文本 框 内 。 

text 文本 框 的 定义 由 在 第 22 行 到 第 25 行 的 程序 代码 完成 ， 该 控件 的 位 置 是 在 窗口 内 的 第 1 
行 第 0 列 ， 即 在 命令 按钮 的 左边 ， 并 通过 第 25 行 的 代码 来 设置 焦点 ， 即 在 窗口 打开 时 ， 光 标的 起 
始 位 置 在 文本 框 的 框 内 。 

同样 ， 最 后 需要 编写 第 26 行 的 mainloop 方法 ， 显 示 窗 口 并 启动 主 循环 ， 以 监听 鼠标 、 键 盘 
等 操作 的 事件 。 运 行 这 个 范例 程序 后 ， 即 可 看 到 如 图 9-2 所 示 的 结果 图 。 选 中 下 拉 列 表 框 中 的 内 
容 后 ， 单 击 “ 选 择 ” 按 钮 ， 就 可 以 在 文本 框 中 看 到 所 选择 的 内 容 。 


下 拉 框 攻占 | 区 


| 
选择 编程 语言 > 
Python 选择 


图 9-2 带 下 拉 列 表 框 的 窗口 


9.1.3” 单 选 框 和 多 行文 本 框 


在 Tkinter 库 中 , 单 选 框 控件 是 Radiobutton 类 型 , 而 可 以 容纳 多 行文 字 的 文本 框 是 Text 类 型 。 
在 下 面 的 tkinterWithRadiobutton.py 范例 程序 中 将 演示 这 两 种 控件 的 用 法 。 


# !/usr/bin/env Python 

# coding=utf-8 

import tkinter 

win = 七 kinter.Tk() 

win.title(" 单 选 框 ") 

win.geometry("200x150") 

# 创建 标签 

tkinter.Label (win,text=' 您 目前 学 的 是 : ') .pack () 
9 ”# 定义 选择 单 选 框 后 执行 的 操作 

10 def handleSelected () : 


oamum 必 swN 


六 text.delete(0.0,tkinter .END) 
了 之 text.insert ('insert',selectVal .get ()) 
13 ”# 创建 单 选项 


14 selectVal = tkinter.StringVar() 
15 selectVal.set('Python') 
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16 pythonSelect = tkinter.Radiobutton (winv,text='Python'vvalue='Python'y 
variable=selectVal, command=handleSelected) .pack() 

17 javaSelect = tkinter.Radiobutton (win,text='Java',value='Java', 
variable=selectVal, command=handleSelected) .pack() 

18 ”# 创建 多 行文 本 框 

19 text = tkinter.Text (win,width=20,height=3) 

20 text.pack() 

21 win.mainloop () 


在 第 16 行 和 第 17 行 中 创建 了 两 个 Radiobutton 类 型 的 单 选 框 , 其 中 text 参数 用 来 指定 单 选 框 
要 显示 的 文字 ，value 参数 用 来 指定 本 单 选 框 的 值 ，variable 则 用 于 传 入 参数 并 绑 定 本 单 选 框 的 变 
量 , 而 command 参数 用 来 指定 单 击 按钮 后 会 触发 的 方法 名 (或 称 为 函数 名 ) 。 在 实际 使 用 中 , value 
和 variable 两 个 参数 一 般 是 配套 使 用 的 。 


(1) 在 第 14 行 和 第 15 行 中 设置 了 初始 化 状态 ， 哪 个 单 选 框 会 被 选中 ， 这 里 的 selectVal 指 
向 variable 参数 ， 而 在 第 15 行 的 set(Python) 参 数 是 指向 value。 

(2) 在 第 10 行 定义 的 触发 方法 handleSelected 中 ， 其 中 在 第 12 行 是 通过 调用 selectVal.get() 
方法 ， 也 就 是 通过 variable 向 多 行文 本 框 Text 内 写 入 值 。 


在 第 19 行 中 定义 了 Text 类 型 的 多 行文 本 框 , 在 刚才 提 到 的 handleSelected 方法 中 的 第 11 行 ， 
在 向 Text 控件 设置 值 之 前 ， 是 通过 调用 delete 方法 清空 了 Text 控件 。 请 注意 ， 这 里 delete 方法 的 
第 1 个 参数 是 0.0， 表 示 从 第 0 行 第 0 列 (索引 从 0 开始 ) 的 位 置 开始 清空 。 

执行 这 个 范例 程序 后 ， 即 可 看 到 如 图 9-3 所 示 的 结果 图 。 在 窗口 刚 打 开 时 ，“Python” 单 选 
框 是 被 默认 选中 的 ， 如 果 在 单 选 框 的 两 个 选项 之 间 切 换 ， 那 么 下 方 的 Text 控件 中 就 会 交替 显示 当 
前 选中 的 内 容 。 


您 目前 学 的 是 
他 Python 
C Java 


Python 


9-3 ” 带 单 选 框 和 多 行文 本 框 的 窗口 


9.1.4” 复 选 框 与 在 Text 内 显示 多 行文 字 


和 单 选 框 相 比 ,在 复 选 框 中 可 以 选择 一 个 或 多 个 值 , 在 9.1.3 小 节 中 的 范例 程序 中 ， 只 在 Text 
控件 中 显示 了 一 行文 字 。 在 下 面 的 tkinterWithCheckbutton.py 范例 程序 中 ， 除 了 将 演示 复 选 框 的 用 
法 之 外 ， 还 将 在 Text 控件 内 示范 显示 多 行文 字 。 


# !/usr/bin/env python 
# coding=utf-8 

import tkinter 

win = tkinter.Tk() 
win.title(" 复 选 框 ") 
win.geometry("150x160") 


umwwnP 
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8 

9 

10 
i 
12 
3 
14 
5 
16 
和 
18 
19 
20 
2 
22 
23 
24 
25 
26 


27 
28 


# 添加 Label 标签 
tkinter.Label (win, text=' 我 已 经 掌握 的 编程 语言 ') .pack (anchor=tkinter.W) 
# 单 击 复 选 框 后 触发 的 函数 
def handleFunc () : 
msg = 1 
# 选中 为 True， 不 选 为 False， 下 同 
if PythonSelected.get () == True: 
msg += PythonCheckButton .cget ('text'); 
msg+="' \n' 
if javaSelected.get() == True: 
msg += javaCheckBotton.cget ('text') 
msg+="' \n' 
if goSelected.get () == True: 
msg += goCheckBotton.cget ('text') 
msg += "\n" 
text.delete(0.0,tkinter .END) 
text.insert('insert',msg) 
# 创建 多 选 框 
PythonSelected = tkinter.BooleanVar() 
PythonCheckButton = tkinter.Checkbutton (win,text="'Python',variable= 
PythonSelected， command=handleFunc) 
pythonCheckButton.pack (anchor=tkinter.W) 
javaSelected = tkinter.BooleanVar () 


29 javaCheckBotton = tkinter.Checkbutton (win, text='Java',variable=javaSelected, 


30 
31 
32 


33 
34 
35 
36 
3 


行 通过 text 参数 来 指定 该 控件 显示 的 文字 ， 通 过 command 参数 来 指定 该 控件 会 触发 的 方法 。 


行 到 第 33 行 是 另外 两 个 复 选 框 控件 定义 的 方法 ,程序 代码 和 刚 


command=handleFunc) 
javaCheckBotton.pack (anchor=tkinter.W) 
goSelected = tkinter.BooleanVar () 


goCheckBotton = tkinter.Checkbutton (win,text='Go',variable=goSelected, 


command=handleFunc) 

goCheckBotton.pack (anchor=tkinter .W) 

# 创建 一 个 多 行文 本 框 

text = tkinter.Text (win,width=20,height=5) 
text .pack (anchor=tkinter.W) 

win.mainloop() 


从 第 25 行 到 第 33 行 的 程序 语句 定义 了 三 个 复 选 框 控件 ， 这 里 以 其 中 显示 “Python” 内 容 的 
复 选 框 为 例 来 说 明 Checkbutton 控件 的 用 法 。 
由 于 复 选 框 存在 “选中 ”和 “ 没 选中 ”这 两 种 状态 , 因此 是 在 第 25 行 中 用 tkinter.BooleanVar()， 
即 布尔 类 型 的 pythonSelected 对 象 来 记录 第 26 行 pythonCheckButton 控件 的 状态 。 此 外 ， 在 第 26 


因为 需要 让 三 个 复 选 框 控件 靠 左 对 齐 ， 所 以 在 第 27 行 调用 pack 方法 放置 该 控件 时 ， 即 指定 
了 anchor=tkinter.W， 即 向 西 ( 即 向 左 ) 靠 齐 。 除 了 这 个 值 以 外 ， 还 可 以 设置 tkinter.E， 表 示 向 东 
( 即 向 右 〉 靠 齐 ，tkinter.N 表示 向 北 〈 即 向 上 ) 靠 齐 ，tkinter.S 表示 向 南 〈 即 向 下 ) 靠 齐 。 第 28 


就 不 再 重复 讲述 了 。 
当 用 户 操作 上 述 三 个 复 选 框 中 的 任意 一 个 时 ， 就 会 触发 从 第 10 行 开始 定义 的 handleFune 方 
法 ,在 该 方法 中 用 第 13 行 、 第 16 行 和 第 19 行 这 三 个 让 语句 来 判断 三 个 复 选 框 是 否 被 选中 ,如 果 
被 选中 ， 则 往 msg 变量 中 添加 当前 复 选 框 的 文字 〈 即 text 属性 ) ， 也 就 是 说 ， 如 果 选 中 多 个 ， 则 


才 说 明 的 第 一 个 复 选 框 类 似 ， 所 以 
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会 以 多 行 的 形式 显示 在 第 35 行程 序 语句 定义 的 Text 类 型 的 多 行文 本 框 中 。 
运行 这 个 范例 程序 之 后 ， 即 可 看 到 如 图 9-4 所 示 的 结果 图 ， 如 果 选 中 多 个 选项 ， 就 会 在 文本 
框 中 看 到 选中 的 多 个 值 ， 在 取消 某 个 复 选 框 后 ， 在 文本 框 内 就 能 看 到 该 值 被 删除 掉 。 


复 选 权 司 本 加 


图 9-4 带 复 选 框 和 多 行文 本 框 的 窗口 
9.2 Tkinter 与 Matplotlib 的 整合 


在 之 前 的 章节 中 ， 已 经 通过 与 股票 的 MACD 等 指标 有 关 的 范例 程序 实践 过 Matplotlib 库 中 诸 
多 绘图 方法 。 但 是 ， 之 前 的 范例 程序 采用 的 是 静态 设置 股票 代码 的 方法 ， 比 如 要 绘制 其 他 股票 的 
MACD 走势 图 时 ， 则 必须 在 范例 程序 中 修改 后 再 次 运行 程序 ， 在 使 用 上 非常 不 方便 。 

与 之 相 比 ,在 整合 了 Tkinter 库 后 ， 如 果 要 绘制 其 他 股票 的 指标 图 ， 则 无 需 重 写 代码 再 重新 运 
行程 序 ， 只 需要 在 GUI 界面 中 输入 相关 股票 的 代码 后 ， 再 单 击 命令 按钮 即 可 。 


9.2.1 整合 的 基础 : Canvas 控件 


Canvas (画布 ) 是 Tkinter 库 中 的 控件 。 在 Canvas 控件 中 ， 不 仅 可 以 绘制 一 些 基 本 的 图 形 ， 
还 可 以 导入 基于 Matplotlib 库 的 图 形 。 

因此 可 以 说 ， 该 控件 是 Matplotlib 库 和 Tkinter 库 整合 的 基础 。 在 下 面 的 tkinterWithCanvas.py 
范例 程序 中 ， 先 来 看 一 下 在 画布 控件 中 绘制 不 同 种 类 图 形 的 用 法 。 


范 
得 # !/usr/bin/env Python 
交 # coding=utf-8 

3 import tkinter as tk 
4 win = tk.Tk() 

5 win.title('Cavas 画布 ') # 设置 窗口 标题 

6 win.geometry("550x350") 

iat canvas = tk.Canvas (win,background='white',width=500,height=300) 
8 canvas.pack() 

9 ”# 绘制 直线 

10 canvas.create line((0, 0), (60, 60), width=2, fill="red") 

11 # 绘制 圆 弧 

12 canvas.create arc((210, 210), (280, 280), fill='yellow',width=3) 
13 ”# 绘制 矩形 

14 canvas.create rectangle(75, 75, 120, 120, fill='green', width=2) 
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# 显示 文字 

canvas .create text (350，200, text=' 演 示 文字 效果 ') 

# 绘制 圆 或 椭圆 ， 取 决 于 外 接 和 矩形 

canvas.create oval(150, 150, 200, 200,fill='red') 

# 连接 由 参数 指定 的 点 ， 绘 制 多 边 形 

point = [(280, 260), (300, 200), (350, 220), (400,280)] 
Canvas.create polygon(point, outline='green', fill='yellow') 
win.mainloop () 


第 7 行程 序 语句 在 创建 Canvas 类 型 的 画布 对 象 时 ， 指 定 了 背景 色 和 大 小 。 在 第 10 行 中 调用 


create line 方法 绘制 直线 ， 该 方法 的 前 两 个 参数 表示 直线 的 起 始 坐标 和 终止 坐标 。 


在 第 12 行 中 调用 create_arc 方法 绘制 圆 弧 ， 前 两 个 参数 同样 表示 起 始 坐标 和 终止 坐标 。 在 第 


14 行 中 调用 create_rectangle 方法 绘制 矩形 ， 该 方法 的 前 4 个 参数 分 别 表示 起 始 位 置 的 x 和 y 坐标 
以 及 终止 位 置 的 x 和 y 坐标 。 在 第 16 行 中 调用 create_text 方法 绘制 文字 ， 其 中 前 两 个 参数 表示 要 
显示 文字 的 起 始 位 置 的 x 和 y 坐标 。 


个 参数 表示 外 接 和 矩形 的 起 始点 的 x、y 坐标 和 终止 点 的 x、y 坐标 。 该 方法 中 设置 的 外 接 矩 形 是 正 


在 第 18 行 中 调用 create_oval 方法 绘制 了 一 个 圆 形 ， 该 方法 其 实 可 以 用 来 绘制 圆 或 椭圆 ， 前 4 


方形 ， 所 以 绘制 出 来 的 是 圆 ， 如 果 指 定 的 外 接 和 矩形 长 度 和 宽度 不 相等 ， 那 么 绘制 出 来 的 就 是 椭圆 。 


在 第 21 行 中 调用 create_polygon 方法 绘制 了 多 边 形 ， 它 是 由 第 一 个 参数 指定 的 若干 个 坐标 点 


连接 而 成 。 运 行 这 个 范例 程序 即 可 看 到 如 图 9-5 所 示 的 结果 。 


图 9-5 在 画布 控件 中 绘制 不 同 的 图 形 


9.2.2 在 Canvas 上 绘制 Matplotlib 图 形 


在 学 习 9.2.1 小 节 范 例 程序 之 后 可 知 ，Canvas 控件 其 实 是 个 容器 ， 在 9.2.1 小 节 的 范例 程序 中 


容纳 了 若干 基本 图 形 。 在 下 面 的 tkinterWithMatplotlib.py 范例 程序 中 将 示范 容纳 基于 Matplotlib 库 
的 对 象 ， 将 Canvas 和 Matplotlib 两 者 进行 整合 。 


arnGODp 


# !/usr/bin/env python 

# coding=utf-8 

import matplotlib.pyplot as plt 

from matplotlib.backends .backend tkagg import FigureCanvasTkAgg 
import numpy as np 

from tkinter import * 
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本 win = Tk() 

8 win.title("tkinter and matplotlib") 

9 figure = plt.figure() 

10 ”# 把 用 matplotlib 绘制 的 操作 定义 在 方法 和 内， 方便 调用 
11 def drawPlotOnCancas(): 


12 ax = figure.add subplot (111) 

13 ax.set title('Matplotlib 整 合 tkinter') 

14 x = np.array([1,2,3,4,5]) 

15 HX PLOt (Xr x*x) 

16 Plt.rcParams['font.sans-serif']=['SimHei'] 


17 # 在 Canvas 上 显示 基于 matplotlib 的 对 象 

18 canvs = FigureCanvasTkAgg (figure, win) 
19 canvs.get tk widget () .Pack() 

20 drawPlotOnCancas() 

21 win.mainloop() 


为 了 在 Canvas 容器 中 整合 基于 Matplotlib 的 对 象 ， 一 般 需 要 有 如 下 三 个 步骤 。 

人 ET 如 第 18 行程 序 语句 所 示 , 通过 调用 FigureCanvasTkAgg 方法 把 包含 基于 Matplotlib 库 
的 figure 对 象 和 基于 Tkinter 库 ( 也 就 是 GUI ) 的 win 对 象 绑 定 到 一 起 。 

02 如 第 19 行 所 示 ， 在 GUI 窗口 上 放置 Canvas 对 象 。 

外 303 如 第 20 行 所 示 ， 调 用 在 第 11 行 定义 的 drawPlotOnCancas 方法 ， 在 figure 内 绘制 一 条 曲 
线 ， 该 步骤 的 关键 是 在 figure 控件 上 通过 调用 Matplotlib 库 的 方法 绘制 图 形 。 由 于 在 第 18 行 的 程序 代码 
中 ， 已 经 把 figure 和 win 绑 定 到 了 一 起 ， 因 此 在 figure 内 绘制 的 图 形 就 能 显示 到 Canvas 画布 上 。 


drawPlotOnCancas 方法 的 具体 执行 过 程 是 ， 在 第 12 行 中 调用 add_subplot 方法 创建 了 一 个 子 
图 ， 并 把 操作 该 子 图 的 句柄 赋值 给 ax 对 象 。 在 第 13 行 通过 ax 对 象 设置 子 图 的 标题 ， 在 第 14 行 
和 第 15 行 调用 plot 方法 绘制 y=x*x 的 曲线 ， 因 为 标题 是 中 文 ， 所 以 在 第 16 行 设置 了 字体 。 

最 后 还 需要 在 第 21 行 调用 mainloop 方法 来 开启 主 循环 ， 否 则 图 形 将 不 会 显示 出 来 。 

运行 这 个 范例 程序 之 后 , 即 可 看 到 如 图 9-6 所 示 的 图 形 ,其 中 的 曲线 是 通过 Matplotlib 的 figure 
和 ax 等 对 象 绘制 出 来 的 ， 而 不 是 通过 调用 Tkinter 库 的 方法 绘制 出 来 的 。 


er and natplotlib 


Matplot1ib 整 合 tkinter 


图 9-6 在 Canvas 画布 中 绘制 基于 Matplotlib 的 图 形 对 象 
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9.2.3 在 GUI 窗口 内 绘制 K 线 图 


在 9.2.2 小 节 的 范例 程序 中 ， 在 Canvas 画布 中 绘制 的 图 形 虽 然 简单 ， 但 也 包含 了 figure 和 ax 
等 基于 Matplotlib 的 对 象 。 在 之 前 章节 的 相关 范例 程序 中 , 可 以 看 到 诸如 坐标 轴 刻 度 、 坐 标 轴 文字 、 
子 图 标题 和 网 格 样式 等 ， 现 在 也 都 可 以 通过 figure 和 ax 等 对 象 绘制 出 来 ， 也 就 是 说 ， 通 过 这 种 整 
合 方式 ， 还 可 以 绘制 出 更 为 复杂 的 图 形 。 

在 下 面 的 drawKLineWithTkinter.py 范例 程序 中 ,将 使 用 9.2.3 小 节 范 例 程 序 给 出 的 整合 方式 ， 
在 Canvas 画布 对 象 内 绘制 出 更 为 复杂 的 K 线 图 、 均 线 图 和 图 例 等 。 

整合 的 目的 是 为 了 引入 GUI 交互 的 效果 ， 在 drawKLineWithTkinter.py 这 个 范例 程序 中 可 以 看 到 
基于 Tkinter 库 的 按钮 控件 及 其 相关 操作 。 这 个 范例 程序 的 代码 包含 的 内 容 比较 多 ， 下 面 分 段 讲 述 。 
1 # !/usr/bin/env Python 
2 # coding=utf-8 
| import matplotlib.pyplot as plt 
4 from matplotlib.backends.backend tkagg import FigureCanvasTkAgg 
bs) import pandas as pd 
6 from mpl finance import candlestick2 ochl 
import tkinter 


首先 导入 所 用 的 库 , 尤 其 请 注意 ,在 第 4 行 导入 了 Tkinter 整 合 Matplotlib 的 FigureCanvasTkAgg 
库 ， 在 第 6 行 导 入 了 绘制 K 线 图 所 用 的 candlestick2_ochl 库 。 
8 win = tkinter.Tk() 
9 df = pd.read csv('D:/stockData/ch6/600895.csv',encoding='gbk',index col=0) 
10 win.title("tkinter 整合 matplotlib") 
11 figure = plt.figure() 
12 canvas = FigureCanvasTkAgg (figure, win) 
13 canvas.get tk widget() .grid(row=0, column=0, columnspan=2) 

在 第 9 行 中 读 入 股票 数据 并 放 入 df 对 象 ， 因 为 这 里 的 重点 是 整合 ， 所 以 就 直接 从 文件 中 读 股 
票 交易 数据 ， 而 没有 从 数据 表 中 读 取 。 

在 第 12 行 的 程序 代码 中 ， 在 Canvas 对 象 中 绑 定 了 Matplotlib 库 中 的 figure 对 象 和 基于 GUI 
的 win 窗口 对 象 ， 在 第 13 行 中 在 放置 canvas 对 象 的 同时 ， 用 grid 参数 指定 了 Canvas 画布 的 位 置 
是 第 1 行 (索引 从 0 开始 ) 第 1 列 ， 并 且 将 横 跨 由 columnspan 参数 指定 的 2 列 。 
14 # 把 用 matplotlib 绘制 的 操作 定义 在 方法 中 ， 方 便 调用 


15 def drawKLineOnCancas(): 


16 plt.clf() ”# 先 清空 所 有 在 plt 上 的 图 形 


| ax = figure.add subplot (111) 

18 ax.set title('600895 张江 高 科 的 kK 线 图 ') 

19 ax = figure.add subplot (111) 

20 # 调用 方法 绘制 K 线 图 

习 王 candlestick2 ochl (ax = ax, opens=df["Open"] .values, 


closes=df["Close"] .values, highs=df["High"] .values, 

lows=df["Low"] .values,width=0.75, colorup="'red', colordown='green') 
22 df['Close'] .rolling (window=3) .mean () .plot (color="red", 1abel='3 日 均线 ') 
23 df['Close'] .rolling (window=5) .mean () .plot (color="blue",1abel='5 日 均线 ') 
24 df['Close'] .rolling (window=10) .mean () .plot (color="green",1label='10 日 均 
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线 ') 
25 plt.legend (loc='best') # 绘制 图 例 
26 plt.xticks (range (len (df.index.values)),df.index.values,rotation=30) 
27 ax.grid(True) # 带 网 格 
28 Plt.rcParams['font.sans-serif']=['SimHei'] 
29 canvas .draw() 


在 从 第 15 行 到 第 29 行程 序 语句 定义 的 drawKLineOnCancas 方法 中 ， 通 过 plt、ax 和 figure 
等 Matplotlib 对 象 绘制 了 K 线 图 和 均线 图 ， 这 部 分 的 代码 之 前 讲 过 ， 就 不 再 重复 说 明了 。 

请 注意 第 16 行 ， 在 绘制 前 需要 调用 pltclfO 清 空 图 形 ， 在 绘制 完成 后 的 第 29 行 ， 由 于 此 时 
Canvas 画布 已 经 和 figure 对 象 绑 定 到 一 起 ， 因 此 可 以 调用 canvas.draw 方法 把 基于 Matplotlib 的 图 
形 绘制 到 Canvas 画布 上 。 

如 果 去 掉 第 16 行 执行 清空 操作 的 程序 代码 ， 那 么 每 次 在 单 击 “开始 绘制 ”按钮 时 ， 就 会 重 瑟 
地 绘制 ， 也 就 是 说 ， 在 Canvas 画布 中 会 看 到 由 多 张 图 闭 加 组 成 的 错误 图 形 。 

30 button =tkinter.Button (win，text=' 开 始 绘制 '，width=10, command= 
drawKLineOnCancas) .grid(row=l,column=0,columnspan=3) 

31 def clearCanvas () : 

四 ELESACIE 人 

33 canvas .draw() 

34 button =tkinter.Button (win，text=' 清 空 '， 

width=10, command=clearCanvas) .grid(row=1,column=1, columnspan=3) 
35 win.mainloop() 

在 第 30 行 定义 了 “开始 绘制 ”的 按钮 ， 通 过 该 按钮 command 参数 定义 的 方法 ， 就 能 看 到 单 
击 该 按钮 后 会 调用 drawKLineOnCancas 方 法 在 画布 上 绘制 K 线 图 ,请 注意 该 按钮 控件 也 是 通过 grid 
方法 指定 位 置 ， 它 被 放置 在 窗口 的 第 2 行 第 1 列 。 

在 第 34 行 定义 的 “清空 ”按钮 中 ， 
它 触发 的 方法 是 在 第 31 行 定义 的 
clearCanvas 方法 ， 在 这 个 方法 中 ， 首 先 
调用 第 32 行 的 方法 清空 基于 Matplotlib 
的 图 形 〈 即 K 线 图 和 均线 图 等 ) ， 随 后 
执行 第 33 行 的 方法 再 次 绘制 Canvas 画 
布 , 由 于 此 时 Canvas 所 绑 定 的 figure 对 
象 内 已 经 没有 图 形 了 ， 因 此 再 次 绘制 操 
作 就 相当 于 重 置 了 画布 。 

同样 需要 像 在 第 35 行 中 那样 调用 
mainloop 方法 开启 主 循环 ， 否 则 无 法 显 
示 GUI 界面。 运行 这 个 范例 程序 之 后 ， 
即 可 看 到 如 图 9-7 所 示 的 初始 化 状态 时 
的 结果 ， 画 布 上 没有 图 形 ， 如 果 单 击 右 
下 方 的 “清空 ”按钮 ， 也 能 看 到 这 个 结 图 9-7 在 Canvas 画布 内 绘制 K 线 图 和 均线 图 初始 化 时 的 结果 
果 。 

如 果 单 击 左下 方 的 “开始 绘制 ”命令 按钮 ， 即 可 看 到 如 图 9-8 所 示 的 结果 ， 其 中 在 Canvas 画 


tkinter 整 从 natplotlib 本 品名 


第 9 章 以 KDJ 范例 程序 学 习 GUI 编程 | 171 


布 内 可 以 看 到 线 图 、 均 线 图 和 图 例 等 的 结果 。 


tinter 整 合 aatplotlib 同 


600895 张 江 高 科 的 K 线 图 


RR 全 < 
B00 


Canvas 画布 内 绘制 K 线 图 和 均线 图 的 结果 


加 
售 


9.3 ”股票 范例 程序 : 绘制 KDJ 指标 


KDJ 指标 也 叫 随机 指标 ， 是 由 乔治 : 蓝 恩 博士 (George Lane) 最 早 提出 的 。 该 指标 集中 包含 了 
强 弱 指标 、 动 量 概念 和 移动 平均 线 的 优点 ， 可 以 用 来 衡量 股价 脱离 正常 价格 范围 的 偏离 程度 。 

本 节 首 先 用 基于 Matplotlib 库 的 方法 绘制 KDJ 指标 ,在 此 基础 上 , 还 将 导入 Tkinter 库 ， 以 加 
入 动态 交互 的 效果 。 


9.3.1 KDJ 指标 的 计算 过 程 


KDJ 指标 的 计算 过 程 是 ， 首 先 获取 指定 周期 (一 般 是 9 天) 内 出 现 过 的 股票 最 高 价 、 最 低 价 
和 最 后 一 个 交易 日 的 收盘 价 ， 随 后 通过 它们 三 者 间 的 比例 关系 来 算出 未 成 熟 随机 值 RSV， 并 在 此 
基础 上 再 用 平滑 移动 平均 线 的 方式 来 计算 K、D 和 J 了 值 。 计 算 完成 后 ， 把 KDJ 的 值 绘 成 曲线 图 ， 
以 此 来 预测 股票 走势 ， 具 体 的 算法 如 下 所 示 。 

GI01Y 计算 周期 内 (n 日 、n 周 等 , n 一 般 是 9 ) 的 RSV 值 ，RSV 也 叫 未 成 熟 随机 指标 值 ， 
是 计算 K 值 、D 值 和 J 了 值 的 基础 。 以 n 日 周期 计算 单位 为 例 ， 计 算 公 式 如 下 所 示 。 


n 日 RSV= (Cn 一 Ln) / (Hn—Ln) x 100 


其 中 ，Cn 是 第 n 日 〈 一 般 是 最 后 一 日 ) 的 收盘 价 ，Ln 是 mn 日 范围 内 的 最 低 价 ，Hn 是 n 日 范 
内 的 最 高 价 ， 根 据 上 述 公 式 可 知 ，RSV 值 的 取 值 范围 是 1 到 100。 如 果 要 计算 n 周 的 RSV 值 ， 
则 Cn 还 是 最 后 一 日 的 收盘 价 ， 但 Ln 和 Hn 则 是 n 周 内 的 最 低 价 和 最 高 价 。 


E302 根据 RSV 计算 K 和 D 值 ， 方 法 如 下 。 
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当日 K 值 =2/3 x 前 一 日 K 值 十 1/3x 当日 的 RSV 值 
当日 D 值 =2/3 x 前 一 日 D 值 十 /3x 当日 K 值 


在 计算 过 程 中 ， 如 果 没有 前 一 日 K 值 或 D 值 ， 则 可 以 用 数字 50 来 代 蔡 。 

在 实际 使 用 过 程 中 ， 一 般 是 以 9 日 为 周期 来 计算 KD 线 ， 根 据 上 述 公 式 ， 首 先是 计算 出 最 近 
9 日 的 RSV 值 ， 即 未 成 熟 随机 值 ， 计 算 公 式 是 9 日 RSV= (C 一 L9) = (H9 一 L9) x 100。 其 中 各 
项 参数 含义 在 步骤 一 中 已 经 提 到 ， 其 次 再 按 本 步骤 所 示 计算 当日 的 K 和 D 值 。 

需要 说 明 的 是 ， 上 式 中 的 平滑 因子 2/3 和 1/3 是 可 以 更 改 的 ， 不 过 在 股市 交易 实践 中 ， 这 两 个 
值 已 经 被 默认 设置 为 23 和 1/3。 

C703 计算 J 值 。J 指标 的 计算 公式 为 : J=3xK -2xD。 从 使 用 角度 来 看 , J 的 实质 是 反映 KK 
值 和 DD 值 的 乖 离 程度 ， 它 的 范围 上 可 超过 100， 下 可 低 于 0。 


最 早 的 KDJ 指标 只 有 K 线 和 D 线 两 条 线 ， 那 个 时 候 也 被 称 为 KD 指标 ， 随 着 分 析 技 术 的 发 
展 ，KD 指标 逐渐 演变 成 KDJ 指标 ， 引 入 了 指标 后 ， 能 提高 KDJ 指标 预测 行情 的 能 力 。 

在 按 上 述 三 个 步骤 计算 出 每 天 的 K、D 和 J 三 个 值 之 后 ， 把 它们 连接 起 来 ， 就 可 以 看 到 KDJ 
指标 线 了 。 


9.3.2 ”绘制 静态 的 KDJ 指标 线 


根据 9.3.1 小 节 给 出 的 KDJ 算法 ， 在 下 面 的 drawKDJ.py 范例 程序 中 将 绘制 股票 “金石 资源 ” 
(股票 代码 为 603505) 从 2018 年 9 月 到 2019 年 5 月 这 段 时 间 内 的 KDJ 走势 图 。 
为 了 突出 算法 重点 ， 在 本 范例 程序 中 ， 和 暂时 不 与 Tkinter 库 整 合 ， 仅 用 到 了 Matplotlib 库 中 的 
相关 方法 ， 并 且 不 再 像 第 8 章 那样 从 数据 库 的 数据 表 中 提取 股票 交易 数据 ， 而 是 直接 从 csv 文件 
中 读 取 股票 交易 数据 。 


1 # !/usr/bin/env Python 

a # coding=utf-8 

各 import matplotlib.pyplot as plt 

4 import pandas as pd 

5 ”# 计算 KDJ 

6 def calKDJ(df) : 

有 df['MinLow'] = df['Low'].rolling(9，min _ Periods=9) .min() 

8 # 填充 NaN 数据 

9 df['MinLow'] .fillna(value = df['Low'].expanding().min()，inplace = True) 

0 df['MaxHigh'] = df['High'] .rolling(9, min periods=9) .max() 

I df['MaxHigh'] .fillna(value = df['High'] .expanding() .max(), inplace = 
True) 

12 df['RSV'] = (df['Close'] - df{['MinLow']) / (df['MaxHigh'] - df['MinLow']) 
» 100 

13 # 通过 for 循环 依次 计算 每 个 交易 日 的 KDJ 值 

14 for i in range(len(df)) : 

15 if i==0: # 第 一 天 

16 df.ix[i,'K"]=50 

县 水 df.ix[i,'D']=50 

18 1f 1>0s 


a a | 
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20 df.1x[ir Dedf.1x[licl Dt2/3 二 35 二 二 人 
21 | 
2 return df 


从 第 6 行 到 第 22 行程 序 语句 定义 的 calKDJ 方 法 中 ， 将 根据 输入 参数 df， 计 算 指定 时 间 范 围 
内 的 KDJ 值 。 

具体 的 计算 步骤 是 ， 在 第 8 行 中 通过 df['Low'].rolling(9, min_periods=9).min(0)， 把 每 一 行 〈 即 
每 个 交易 日 ) 的 "MinLow' 属性 值 设置 为 9 天 内 收盘 价 (Low ) 的 最 小 值 。 

如 果 只 执行 这 句 ， 第 1 到 第 8 个 交易 日 的 MinLow 属性 值 将 会 是 NaN， 所 以 要 通过 第 9 行 的 
程序 代码 ， 把 这 些 交 易 日 的 MinLow 属性 值 设置 为 9 天 内 收盘 价 〈Low) 的 最 小 值 。 同 理 ， 通 过 
第 10 行 的 程序 代码 ， 把 每 个 交易 日 的 "MaxHigh' 属性 值 设置 为 9 天 内 的 最 高 价 ， 同 样 通过 第 11 
行 的 flina 方法 ， 填 充 前 8 天 的 "MaxHigh' 属性 值 。 随 后 在 第 12 行 中 根据 算法 计算 每 个 交易 日 的 
RSV 值 。 

在 算 完 RSV 值 后 ， 通 过 第 14 行 的 for 循环 ， 依 次 遍历 每 个 交易 日 ， 在 遍历 时 根据 KDJ 的 算 
法 分 别 计算 出 每 个 交易 日 对 应 的 KDJ 值 。 

请 注意 ， 如 果 是 第 1 个 交易 日 ， 则 在 第 16 行 和 第 17 行 的 程序 代码 中 把 K 值 和 D 值 设置 为 
默认 的 50， 如 果 不 是 第 1 交易 日 ， 则 通过 第 19 行 和 第 20 行 的 算法 计算 K 值 和 D 值 。 计 算 完 K 
和 D 的 值 以 后 ， 再 通过 第 21 行 的 程序 代码 计算 出 每 个 交易 日 的 J 值 。 

从 上 述 代码 中 ， 可 以 看 到 关于 DataFrame 对 象 的 三 个 操作 技巧 : 

(1) 如 第 9 行 所 示 ， 如 果 要 把 修改 后 的 数据 写 回 到 DataFrame 中 ， 必 须 加 上 inplace = True 
的 参数 ; 

(2) 在 第 12 行 中 ，dff'Close] 等 变量 值 是 以 列 为 单位 ， 也 就 是 说 ， 在 DataFrame 中 ， 可 以 直 
接 以 列 为 单位 进行 操作 ; 

(3) 在 第 16 行 的 代码 dfix[i"K]=50， 这 里 用 到 的 是 ix 通过 索引 值 和 标签 值 来 访问 对 象 ， 而 
实现 类 似 功能 的 loc 和 iloc 方法 只 能 通过 索引 值 来 访问 。 


23 # 绘制 KDJ 线 

24 def drawKDJ() : 

25 df = pd.read csv('D:/stockData/ch8/6035052018-09-012019-05-31.csv', 
encoding='gbk') 

26 stockDataFrame = calKDJ (df) 

Zh print (stockDataFrame) 

28 # 开始 绘图 

29 plt.figure() 

30 stockDataFrame['K'] .plot (color="blue",1label="'K') 

六 stockDataFrame['D'] .plot (color="green", label='D') 

32 stockDataFrame['J'] .plot (color="purple",1label="'J') 

33 plt.legend (loc='best') # 绘制 图 例 


34 # 设置 x 轴 坐 标的 标签 和 旋转 角度 

major index=stockDataFrame.index[stockDataFrame.index%10==0] 
35 major xtics=stockDataFrame['Date'] [stockDataFrame.index%10==0] 
36 Plt.xticks (major index,major xtics) 
37 plt.setp(plt.gca() .get xticklabels(), rotation=30) 
38 # 带 网 格 线 ， 且 设置 了 网 格 样式 
39 plt.grid(linestyle='-.') 
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40 plt.title ("金石 资源 的 KDJ 图 ") 

41 plt.rcParams['font.sans-serif']=["'SimHei'] 
42 Plt.show() 

43”# 调用 方法 


44 drawKDJ() 


在 第 24 行 的 drawKDJ 方法 中 实现 了 绘制 KDJ 的 操作 。 其 中 的 关键 步骤 是 ， 通 过 第 25 行 的 
程序 代码 从 指定 的 csv 文件 中 读 取 股 票 交易 数据 ， 随 后 在 第 30 行 到 第 32 行 的 程序 代码 中 ， 调 用 
plot 方法 分 别 用 三 种 不 同 的 颜色 绘制 了 KDJ 线 ， 因 为 在 绘制 时 通过 label 参数 设置 了 标签 ， 所 以 可 
以 执行 第 33 行 的 程序 代码 来 绘制 图 例 。 

在 第 34 行 到 第 37 行 的 代码 中 设置 了 x 轴 的 文字 标签 和 旋转 角度 ， 这 部 分 代码 与 之 前 绘制 
MACD 指标 线 的 代码 很 相似 ， 为 了 不 在 x 轴 上 过 多 地 显示 日 期 ， 于 是 用 ， stockDataFrame.index%10 
== 0 的 方式 ， 只 显示 索引 值 是 10 的 倍数 的 日 期 。 

在 第 44 行 调用 了 drawKDIJ 方法 将 KDJ 绘制 出 来 。 运行 这 个 范例 程序 之 后 , 即 可 看 到 如 图 9-9 
所 示 的 结果 ， 其 中 KDJ 三 根 曲 线 分 别 用 蓝 色 、 绿 色 和 紫色 绘制 出 来 〈 因 为 本 书 采用 黑白 印刷 而 看 
不 出 彩色 ， 请 读者 在 自己 的 计算 机 上 运行 这 个 范例 程序 ) 。 

金石 资源 的 KDJ 图 


A 中 入 QQ 
本 的 NA A A sss Re RS ss 
人 从 从 A 人 


图 9-9 金石 资源 从 2018 年 9 月 到 2019 年 5 月 的 KDJ 走 势 图 


图 9-10 是 从 股票 软件 中 得 到 的 股票 “金石 资源 ”在 同时 间 段 内 的 KDJ 走势 图 ， 两 者 的 变化 
趋势 基本 一 致 。 


指标 说 明 


图 9-10 ”金石 资源 从 2018 年 9 月 到 2019 年 5 月 的 KDJ 走势 图 (股票 软件 版 7 
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9.3.3 ”根据 界面 的 输入 绘制 动态 的 KDJ 线 


在 9.3.2 小 节 的 drawKDJ.py 范例 程序 中 ， 是 以 静态 的 方式 绘制 了 指定 股票 代码 在 指定 时 间 范 


围 内 的 KDJ 曲线 ， 在 本 节 的 drawKDJWithTkinter.py 范例 程序 中 ， 将 根据 从 GUI 界面 中 输入 的 股 


票 代码 和 时 间 范 F 


， 从 网 站 疏 取 对 应 的 股票 交易 数据 ， 随 后 再 绘制 相应 的 K 线 图 、 均 线 图 与 KDJ 


指标 图 。 这 个 范例 程序 的 代码 比较 长 ， 下 面 将 分 步骤 讲述 。 


oaouwmewnbP 


# !/usr/bin/env Python 

# coding=utf-8 

import matplotlib.pyplot as plt 

import pandas as pd 

import pandas datareader 

from mpl finance import candlestick2 ochl 

from matplotlib.backends.backend tkagg import FigureCanvasTkAgg 
import tkinter 


在 上 述 代 码 中 导入 了 这 个 范例 程序 中 所 用 的 依赖 库 ， 其 中 第 6 行 导入 的 库 用 来 绘制 K 线 图 ， 


第 7 行 导入 的 库 用 来 整合 Tkinter 库 与 Matplotlib 库 ， 第 5 行 导入 的 库 提供 了 get_data_yahoo 方法 
从 雅虎 网 站 疏 取 股票 交易 数据 。 


9 

10 
Ll 
12 
13 
14 
15 
16 
S71 
18 
19 
20 
2 


22 
23 


24 


25 


26 
27 
28 
人 
30 
31 


# 计算 KDJ 
def calKDJ(df) : 
# 省 略 相关 代码 ， 请 参考 本 书 提供 下 载 的 完成 范例 程序 
# 绘制 KDJ 线 
def drawKDJAndKLine (stockCode, startDate,endDate): 
filename='D:\\stockData\ch9\\'+stockCode +startDate+endDate+' .csv' 
getStockDataFromAPI (stockCode, startDate, endDate) 
df = pd.read csv(filename,encoding="'gbk') 
stockDataFrame = calKDJ (df) 
# 创建 子 图 
(axPrice, axKDJ) = figure.subplots(2, sharex=True) 
# 调用 方法 ， 在 axPrice 子 图 中 绘制 K 线 图 
candlestick2 ochl (ax = axPrice，opens=stockDataFrame ["Open"] .values, 
closes=stockDataFrame ["Close"] .values, highs=stockDataFrame ["High"] .values, 
lows=stockDataFrame["Low"] .values, width=0.75, colorup='red', 
colordown='green') 
axPrice.set title("K 线 图 和 均线 图 ")  # 设置 子 图 标题 
stockDataFrame['Close'] .rolling (window=3) .mean (). 
plot (ax=axPrice, color="red",，1label='3 日 均线 ') 
stockDataFrame['Close'] .rolling (window=5) .mean() . 
plot (ax=axPrice, color="blue",，1label='5 日 均线 ') 
stockDataFrame['Close'] .rolling (window=10) .mean() . 
plot (ax=axPrice, color="green",，1label='10 日 均线 ') 


axPrice.legend (loc='best') # 绘制 图 例 
axPrice.set_ylabel ("价格 (单位 : 元 ) ") 
axPrice.grid(linestyle='-.') # 带 网 格 线 


# 在 axKDJ 子 图 中 绘制 KDJ 
stockDataFrame['K'] .plot (ax=axKDJ, color="blue",1label="'K') 
stockDataFrame['D'] .plot (ax=axKDJ, color="green", label="'D') 
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32 stockDataFrame['J'] .plot (ax=axKDJ, color="purple", label='J') 
33 plt.legend (loc='best') # 绘制 图 例 

34 plt.rcParams['font.sans-serif']=['SimHei'] 

35 axKDJ.set _ title("KDJ 图 ") # 设置 子 图 的 标题 

36 axKDJ.grid(linestyle="'-.') # 带 网 格 线 

3 # 设置 x 轴 坐 标的 标签 和 旋转 角度 

38 major index=stockDataFrame.index[stockDataFrame. index%5==0] 
39 major xtics=stockDataFrame['Date'] [stockDataFrame. index%5==0] 
40 Plt.xticks (major index,major xtics) 

41 plt.setp(plt.gca() .get xticklabels(), rotation=30) 


第 10 行 定义 的 calKDJ 方 法 是 根据 传 入 的 DataFrame 类 型 的 df 对象, 计算 KDJ 值 , 这 个 方法 
与 之 前 范例 程序 中 的 基本 相似 ， 所 以 就 不 再 给 出 代码 和 说 明 ， 读 者 可 以 自行 参考 本 书 提供 下 载 的 
完整 范例 程序 。 

在 第 13 行 的 drawKDJAndKLine 方法 中 , 是 根据 输入 参数 所 提供 的 股票 代码 , 开始 时 间 和 结束 时 
间 ， 从 网 站 疏 取 股票 交易 数据 ， 再 调用 Matplotlib 库 中 的 方法 绘制 K 线 图 、 均 线 图 和 KDJ 指标 图 。 

具体 的 执行 步骤 是 ， 调 用 第 15 行 的 方法 从 网 站 疏 取 股票 交易 数据 并 写 入 本 地 的 csv 文件 中 ， 
第 16 行 的 程序 语句 把 本 地 csv 文件 中 的 信息 读 入 df 对 象 , 随后 再 通过 第 17 行 的 代码 在 df 对 象 中 
再 加 入 KDJ 指标 的 信息 。 

在 第 19 行 中 创建 了 axPrice 和 axKDJ 这 两 个 子 图 , 在 第 一 个 子 图 内 绘制 K 线 与 均线 , 在 第 二 
个 子 图 里 绘制 KDJ 指标 线 ， 而 且 这 两 个 子 图 是 共享 x 轴 刻 度 和 标签 信息 的 。 

之 后 在 第 21 行 到 第 28 行 的 程序 代码 中 ， 在 axPrice 子 图 内 绘制 了 K 线 和 3 日 、5 日 与 10 日 
均线 ， 这 部 分 的 代码 之 前 讲述 过 ， 就 不 再 袭 述 了 。 在 第 30 行 到 第 32 行 的 程序 代码 中 ， 也 是 通过 
调用 plot 方 法 ,在 axKDJ 子 图 内 绘制 了 三 根 曲线 , 分 别 代表 KDJ 线 ,它们 的 颜色 各 不 相同 ， 在 第 
33 行 中 为 KDJ 三 根 曲线 绘制 了 图 例 。 

在 第 38 行 到 第 40 行 的 程序 代码 中 设置 了 axKDJ 子 图 x 轴 的 标签 和 刻度 ， 为 了 避免 x 轴 刻 度 
过 于 密集 ， 这 里 是 以 stockDataFrame.index%5==0 的 方式 ， 只 显示 索引 值 是 5 的 倍数 的 日 期 。 在 第 
41 行 中 把 刻度 标签 文字 旋转 了 30 度 。 

42 # 从 API 中 获取 股票 数据 
43 def getStockDataFromAPI (stockCode, startDate,endDate): 


44 try: 

45 # 给 股票 代码 加 ss 前 级 来 获取 上 证 股票 的 数据 

46 stock = pandas datareader.get data yahoo(stockCode+'.ss', 
startDate,endDate) 

47 if(lenl(stock)<1): 

48 # 如 果 没有 取 到 数据 ， 则 抛 出 异常 

49 raise Exception() 

50 # 删除 最 后 一 行 ， 因为 get_data_yahoo 会 多 取 一 天 股票 交易 数据 

与 主 stock.drop (stock.index[len(stock)-1],inplace=True) 

52 # 在 本 地 留 份 csv 

53 filename="'D:\\stockData\ch9\\'+stockCode +startDate+endDate+' .csv' 

54 stock.to_csv (filename) 

55. except Exception as e: 

56 print('Error when getting the data of:' + stockCode) 


57 Print (repr (e)) 
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在 第 43 行 定 义 的 getStockDataFromAPI 方法 中 ， 调 用 了 get_data_yahoo 方法 从 雅虎 网 站 怜 取 
票 交易 数据 。 在 第 46 行 给 股票 代码 加 上 ss 后 组 来 获取 上 证 股票 的 数据 ， 如 果 没 有 取 到 数据 ， 
则 在 第 49 行使 用 raise 语句 抛 出 异常 。 在 爬 取 到 股票 数据 后 ， 在 第 54 行 把 数据 以 csv 格式 存储 到 
本 地 文件 中 做 一 个 备份 ， 方 便 以 后 读 取 。 


58 # 设置 tkinter 窗口 

59 win = tkinter.Tk() 

60 win.geometry('625x600') # 设置 大 小 

61 win.title("K 线 均线 整合 KDJI") 

62 # 放置 控件 

63 tkinter.Label (win,text=' 股 票 代码 : ') .place (x=10,y=20) 

64 tkinter.Label (win,text=' 开 始 时 间 : ') .Place (x=10,y=50) 

65 tkinter.Label (win,text=' 结 束 时 间 : ') .place (x=10,y=80) 

66 stockCodeVal = tkinter.StringVar() 

67 startDateVal = tkinter.StringVar() 

68 endDateVal = tkinter.StringVar () 

69 stockCodeEntry = tkinter.Entry (win,textvariable=stockCodeVal) 
70 stockCodeEntry.place(x=70,y=20) 

71 stockCodeEntry.insert(0,'600640') 

72 startDateEntry = tkinter.Entry (win,textvariable=startDateVal) 
73 startDateEntry.place(x=70,y=50) 

74 startDateEntry.insert(0,'2019-01-01') 

75 endDateEntry = tkinter.Entry (win,textvariable=endDateVal) 

76 endDateEntry.place(x=70,y=80) 

77 endDateEntry.insert(0,'2019-05-31') 


在 第 60 行 设置 了 Tkinter 窗口 的 大 小 , 在 第 61 行 设置 了 窗口 的 标题 。 从 第 63 行 到 第 65 行 的 
程序 语句 设置 了 3 个 标签 ， 是 通过 调用 place 方法 指定 了 标签 放置 的 位 置 。 

从 第 69 行 到 第 71 行 的 程序 语句 设置 了 接收 “股票 代码 ”的 文本 框 ， 并 通过 insert 语句 设置 
了 该 文本 框 的 默认 值 ， 而 该 文本 框 的 值 会 保存 在 第 66 行 定义 的 stockCodeVal 对 象 中 。 同样 , 在 第 
72 行 到 第 74 行 设置 了 接收 “开始 时 间 ” 的 文本 框 ， 在 第 75 行 到 第 77 行 设置 了 接收 “结束 时 间 ” 
的 文本 框 。 


78 def draw() : # 绘制 按钮 触发 的 处 理 函数 〈 或 方法 ) 
79 plt.clf() ， ## 先 清空 所 有 在 plt 上 的 图 形 


80 stockCode=stockCodeVal .get () 

81 startDate=startDateVal .get () 

82 endDate=endDateVal .get () 

83 drawKDJAndKLine (stockCode, startDate, endDate) 
84 canvas .draw () 


85 tkinter.Button(win,text=' 绘 制 ',width=12,command=draw) .Place (x=200,y=50) 


在 第 85 行 定义 了 “绘制 ”命令 按钮 ， 它 触发 的 处 理 函 数 〈 或 方法 ) “draw” 的 定义 在 第 78 
行 到 第 84 行 。 

在 这 个 处 理 函 数 中 ， 首 先是 通过 第 79 行 的 程序 代码 清空 plt 上 的 图 形 ， 否 则 会 出 现 图 形 重 装 
的 情况 ， 随 后 在 第 80 行 到 第 82 行 中 用 三 个 变量 接收 从 界面 输入 的 股票 代码 、 开 始 时 间 和 结束 时 
间 的 属性 值 ， 并 把 它们 作为 参数 传 入 第 83 行 的 drawKDJAndKLine 方法 中 。 因 为 已 经 完成 了 
Matplotlib 对 象 与 Tkinter 对 象 的 整合 ， 所 以 需要 用 第 84 行 的 代码 把 图 形 绘制 到 画布 上 。 
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86 def reset(): 


87 stockCodeEntry.delete (0,tkinter .END) 
88 stockCodeEntry.insert (0,'600640') 

89 startDateEntry.delete (0,tkinter .END) 
90 startDateEntry.insert (0,'2019-01-01°') 
91 endDateEntry.delete (0,tkinter .END) 

92 endDateEntry.insert (0,'2019-05-31') 
93 PLU.CLE() 

94 canvas .draw() 


95 tkinter.Button(win,text=' 重 置 ', width=12,command=reset) .place (x=200,y=80) 


在 第 95 行 定义 了 “ 重 置 ” 命 令 按 钮 ， 它 触发 的 处 理 函 数 〈 或 方法 ) “reset” 的 定义 在 第 86 
行 到 第 94 行 。 在 这 个 处 理 函数 中 ,通过 第 87 行 到 第 92 行 的 程序 语句 重新 设置 了 股票 代码 、 开 始 
时 间 和 结束 时 间 这 三 个 文本 框 的 值 。 随 后 在 第 93 行 清空 了 Canvas 画布 plt 内 的 图 形 对 象 ， 再 通过 
第 94 行 的 代码 重新 绘制 Canvas， 以 达到 清空 画布 的 效果 。 

96 ## 开始 整合 figure 和 win 

97 figure = Plt.figure() 

98 canvas = FigureCanvasTkAgg (figure, win) 

99 canvas.get tk widget().config(width=575,height=500) 
100 canvas.get tk widget() .Place (x=0,y=100) 

101 win.mainloop () 

在 第 98 行 中 通过 FigureCanvasTkAgg 方法 整合 了 基于 Matplotlib 库 的 figure 对 象 和 面向 GUI 
界面 的 win 对 象 ， 在 第 99 行 中 通过 了 config 方法 设置 了 Canvas 画布 的 大 小 ， 在 第 100 行 中 通过 
调用 place 方法 设置 了 Canvas 画布 的 位 置 。 最 后 还 需要 像 第 101 行 那样 启动 win 界面 的 主 循环 以 
监听 鼠标 和 键盘 等 操作 的 事件 ， 否 则 界面 无 法 显示 出 来 。 

运行 这 个 范例 程序 之 后 ， i Canvas 画布 上 没有 图 形 ， 单 击 “ 绘 制 ” 按 钮 后 ， 
就 能 看 到 在 画布 中 显示 了 股票 “ 士 兰 微 ”( 股 票 代码 为 600460) 从 20190101 到 20190531 这 段 时 
间 内 的 k 线 图 、 均 线 图 和 KDJ 图 ， 如 图 9-11 所 示 。 


F 绪 均线 区 合 ID 


Cs En 
Fat + oT 
Mh :010-31 


k 线 图 和 均线 图 


图 9-11 股票 “ 士 兰 微 ” 的 k 线 图 、 均 线 图 和 KDJ 
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从 图 9-11 中 可 以 看 到 标签 、 文 本 框 、 命 令 按钮 和 画布 ， 而 且 还 可 以 在 画布 上 看 到 相关 股票 指 
标 整合 后 的 效果 ， 具 体 在 下 方 的 KDJ 子 图 中 ， 根 据 图 例 可 以 看 到 三 根 不 同 颜色 的 曲线 分 别 对 应 
KDJ 线 。 如 果 单 击 “ 重 置 ” 命 令 按钮 ， 即 可 看 到 如 图 9-12 所 示 的 结果 ， 其 中 三 个 文本 框 中 的 值 被 
重 置 为 默认 值 ， 同 时 画布 中 的 图 形 被 清空 了 。 


股票 代码 : 600640 
开始 时 | 间 :12019-01-01 给 制 
结束 时 间 :2019-05-31 重合 | 


9-12 单 击 重 置 按钮 后 的 效果 图 


如 果 在 “股票 代码 ”的 文本 框 中 输入 其 他 上 证 的 股票 代码 ， 比 如 600776〈 东 方 通信 ) ， 并 在 
时 间 文 本 框 中 更 改 开 始 时 间或 结束 时 间 ， 比 如 把 开始 时 间 更 改 为 2018-12-01， 再 单 击 “ 绘 制 ” 按 
钮 ， 即 可 看 到 该 股票 在 指定 范围 内 的 指标 图 ， 如 图 9-13 所 示 。 
E 线 均线 整 辣 EDJ 


股票 代码 :E00776 
A 时间 :015 下 0 
结 夺 间 :2013-05-31 


K 线 图 和 均线 图 


一 


TY 


图 9-13 ”股票 “东方 通信 ”的 k 线 图 、 均 线 图 和 KDJ 图 


这 里 请 注意 输入 的 时 间 格 式 ， 必 须 和 怜 取 股 票 交易 数据 的 网 站 的 时 间 格 式 保持 一 致 ， 否 则 就 
会 出 现 问题 ， 而 且 本 范例 程序 只 支持 上 证 股票 ， 如 果 输入 其 他 交易 所 的 股票 代码 ， 也 会 有 问题 。 


9.4 验证 基于 KDJ 指标 的 交易 策略 


本 节 将 介绍 股票 交易 理论 中 基于 KDJ 指标 的 常用 交易 策略 ， 并 用 Python 程序 实现 并 验证 买 
卖 策略 。 因 为 在 9.3 节 已 经 实现 了 基于 GUI 交互 的 绘制 效果 ， 所 以 在 本 节 的 验证 工作 相对 来 说 会 
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简单 很 多 。 


9.4.1 KDJ 指标 对 交易 的 指导 作用 


KDJ 指标 的 波动 与 买卖 信号 有 着 紧密 的 关联 ,根据 KDJ 指标 的 不 同 取 值 ， 可 以 把 这 指标 划分 
成 三 个 区 域 : 超 买 区 、 超 卖 区 和 观望 区 。 一 般 而 言 ，KDJ 这 三 个 值 在 20 以 下 为 超 卖 区 ， 这 是 买 入 
信号 ; 这 三 个 值 在 80 以 上 为 超 买 区 ， 是 卖 出 信号 ; 如 果 这 三 个 值 在 20 到 80 之 间 则 是 在 观望 区 。 

如 果 再 仔细 划分 一 下 ， 当 KDJ 三 个 值 在 50 附近 波动 时 ， 表示 多 空 双方 的 力量 对 比 相 对 均衡 ， 
当 三 个 值 均 大 于 50 时 ， 表 示 多 方 力 量 有 优势 ， 反 之 当 三 个 值 均 小 于 50 时 ,表示 空 方 力 量 占 优势 。 

下 面 根据 KDJ 的 取 值 以 及 波动 情况 ， 列 出 交易 理论 中 比较 常见 的 买卖 策略 。 


(1) KDJ 指标 中 也 有 人 金 叉 和 死 又 的 说 法 ， 即 在 低位 K 线 上 穿 D 线 是 金 叉 ， 是 买 入 信号 ， 反 
之 在 高 位 K 线 下 穿 D 线 则 是 死 叉 ， 是 卖 出 信号 。 

(2) 一 般 来 说 ，KDJ 指标 中 的 D 线 由 向 下 趋势 转变 成 向 上 是 买 入 信号 ， 反 之 ， 由 向 上 趋势 
变 成 向 下 则 为 卖 出 信号 。 

(3) K 的 值 进入 到 90 以 上 为 超 买 区 ，10 以 下 为 超 卖 区 。 对 DD 而 言 ， 进 入 80 以 上 为 超 买 区 ， 
20 以 下 为 超 卖 区 。 此 外 ,对 K 线 和 DD 线 而 言 ,数值 50 是 多 空 均衡 线 。 如 果 当 前 态势 是 多 方 市 场 ， 
50 是 回 档 的 支持 线 ， 即 股价 回 探 到 KD 值 是 50 的 状态 时 ， 可 能 会 有 一 定 的 支撑 ， 反 之 如 果 是 空 方 
市 场 ，50 是 反弹 的 压力 线 ， 即 股价 上 探 到 KD 是 50 的 状态 时 ， 可 能 会 有 一 定 的 向 下 打压 的 压力 。 

(4) 一 般 来 说 ， 当 J 值 大 于 100 是 卖 出 信号 ， 如 果 小 于 10， 则 是 买 入 信号 。 


当然 ， 上 述 策略 仅 针对 KDJ 指标 而 言 ， 在 现实 的 交易 中 ， 更 应 当 从 政策 、 消 息 、 基 本 面 和 资 
金 流 等 各 个 方面 综合 考虑 。 


9.4.2 ”基于 Tkinter 验证 KDJ 指标 的 买点 


根据 KDJ 指标 的 特性 ， 制 定 的 “ 买 入 ”策略 是 ， 前 一 个 交易 日 1 值 大 于 10 且 本 交易 日 J 值 小 
于 10， 或 者 在 数值 20 之 下 在 K 线 上 穿 D 线 〈 即 出 现金 叉 ) 。 

在 drawKDJWithTkinter.py 范例 程序 中 , 可 以 根据 界面 的 输入 来 灵活 地 绘制 指定 股票 在 指定 时 
间 范 围 内 的 指标 图 。 而 在 下 面 的 calKDJBuyPoints.py 范例 程序 中 , 是 以 上 述 界面 为 基础 加 一 个 “ 计 
算 买点 ”的 按钮 ， 具 体 修改 的 程序 代码 如 下 。 

修改 点 1: 通过 如 下 的 代码 增加 消息 对 话 框 的 支持 库 ， 为 的 是 支持 在 这 个 范例 程序 中 可 以 在 
messagebox 弹出 框 中 显示 出 买点 日 期 。 


import tkinter.messagebox 


修改 点 2: 通过 如 下 代码 在 界面 中 增加 了 “计算 买点 ”的 命令 按钮 ， 它 触发 的 处 理 函 数 (或 
方法 ) 是 printBuyPoints 。 


tkinter.Button (win, text=' 计 算 买 点 ' ,width=12, command= 
printBuyPoints) .place (x=300,y=50) 


修改 点 3: 增加 了 计算 买点 的 printBuyPoints 方法 ， 代 码 如 下 。 
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1  # 以 对 话 框 的 形式 输出 买点 

2 def printBuyPoints () : 

2 stockCode=stockCodeVal .get () 

4 startDate=startDateVal .get () 

; endDate=endDateVal .get () 

6 filename='D:\\stockData\ch9\\'+stockCodetstartDatetendDate+' .csv' 

yl getStockDataFromRAPI (stockCode, startDate, endDate) 

8 df = pd.read csv(filename,encoding='gbk') 

9 stockDf = calKDJ (df) 

10 cnt=0 

LE buyDate="" 

和 while cnt<=len (stockDf)-1: 

13 if (cnt>=5): # 略 过 前 几 天 的 误差 

14 # 规则 1: 前 一 天 J 值 大 于 10， 当 天 J 值 小 于 10， 是 买点 

15 if stockDf.iloc[cnt] ['J']<10 and stockDf.iloc[cnt-1]['J']>10: 

16 buyDate = buyDate+stockDf.iloc[cnt]['Date'] + ',"' 

17 cnt=cnt+1 

18 continue 

19 # 规则 2: K,D 均 在 20 之 下 ， 出 现 K 线 上 穿 D 线 的 金 叉 现象 

20 # 规则 1 和 规则 2 是 “或 ”的 关系 ， 所 以 当 满 足 规则 1 时 直接 continue 

昌 if stockDf.iloc[cnt] ['K']>stockDf.iloc[cnt]['D'] and 
stockDf.iloc[cnt-1] ['D'] > stockDf.iloc[cnt-1]['K']: 

22 # 满足 上 穿 条 件 后 再 判断 K 和 D 均 小 于 20 

要 3 if stockDf.iloc[cnt]['K']< 20 and stockDf.iloc[cnt]['D']<20: 

24 buyDate = buyDate + stockDf.iloc[cnt]['Date'] + ',' 

25: cnt=cnt+1 

26 # 完成 后 ， 通 过 对 话 框 的 形式 显示 买 入 日 期 

2 tkinter .messagebox.showinfo(' 提 示 买 点 ', buyDate) 


在 前 9 行 中 ， 根 据 文 本 框 的 值 ， 对 应 到 股票 代码 、 开 始 时 间 和 结束 时 间 这 三 个 参数 来 获取 对 
应 的 股票 交易 数据 ， 在 第 9 行 调用 calKDJ 方法 算出 了 每 个 交易 日 的 KDJ 值 。 

在 第 12 行 的 while 循环 中 ， 依 次 遍历 的 每 个 交易 日 的 数据 ， 为 了 避免 开始 几 天 的 误差 ， 通 过 
第 13 行 的 让 语句 过 滤 掉 了 前 5 个 交易 日 的 数据 。 

从 第 15 行 到 第 18 行 的 让 语句 中 ,根据 了 值 判 断 买点 ， 上 有 具体 的 执行 过 程 是 ， 如 果 前 一 个 交易 
日 的 J 值 大 于 10 且 本 交易 日 的 J 值 小 于 10， 则 在 当天 可 以 买 进 股票 。 由 于 规则 1 是 独立 的 ， 因 此 
满足 该 条 件 后 ， 执 行 第 16 行 的 程序 代码 把 当天 的 日 期 记录 到 buyDate 变量 中 ， 并 执行 第 18 行 的 
continue 语句 结束 本 轮 次 的 while 循环 ， 并 进入 下 一 轮 次 的 循环 。 

在 第 21 行 和 第 23 行 中 的 两 个 让 判断 语句 中 ， 根 据 K 值 和 D 值 来 判断 买点 ， 即 在 当天 天 值 
和 D 值 均 小 于 20 的 前 提 下 ,判断 K 值 有 没有 上 穿 D 值 形 成 金 叉 ， 如 果 是 ， 则 执行 第 24 行 的 程序 
代码 把 当天 的 日 期 记录 到 buyDate 变量 中 。 

当 while 循环 遍历 完成 后 , 执行 第 27 行 的 代码 , 以 messagebox 消息 框 的 形式 显示 诸多 买点 的 
日 期 。 

运行 范例 程序 的 这 部 分 代码 ， 就 能 看 到 如 图 9-14 所 示 的 界面 ， 其 中 多 了 一 个 “计算 买点 ”的 
按钮 。 
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了 线 均线 整合 KDJ 


股票 代码 :|600640 


开始 时 间 :|2019-01-01 蛤 制 计算 买点 


结束 时 间 :|2019-05-31 重 置 | 


图 9-14 多 了 一 个 “计算 买点 ”的 按钮 


下 面 换 一 个 股票 来 验证 ,在 股票 代码 里 输入 600897 (厦门 空港 ) ,开始 时 间 和 结束 时 间 不 变 ， 
先 单 击 “ 绘 制 ” 按 钮 以 绘制 出 该 股 在 这 段 时 间 内 的 K 线 、 均线 和 KDJ 指标 图 , 再 单 击 “ 计 算 买 点 ” 
按钮 ， 即 可 看 到 如 图 9-15 所 示 的 画面 。 


股票 代码 : 500697 
开始 时 间 : 2019-01-01 
蛙 束 时 间 :2019-05-31 


K 
je 
0 


区 


NA 人 
sk 
图 9-15 用 股票 “厦门 空港 ”来 验证 KDJ 买点 策略 


在 表 9-1 中 ， 归 纳 了 对 KDJ 指标 各 买点 的 分 析 情 况 。 


表 9-1 基于 KDJ 指标 得 到 的 买点 情况 确认 表 
对 买点 的 分 析 


该 日 7 指标 低 于 0， 后 市 股价 有 一 定 的 上 涨 

2019-03-28 该 日 了 指标 低 于 10， 后 市 股价 有 一 定 的 上 涨 正确 

| 2019-04-25 | 该 日 指标 在 0 点 附近 ， 后 市 股价 有 一 定 的 上 涨 | 正确 

| 2o19.05-23 ”| 该 日 1 指标 在 0 点 附近 ， 后 市 股价 虽 有 上 涨 ， 但 涨幅 不 大 ”| 不 明确 
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9.4.3 ”基于 Tkinter 验证 KDJ 指标 的 卖点 


根据 KDJ 指标 的 特性 ， 制 定 的 “ 卖 出 ”策略 是 ， 前 一 个 交易 日 了 值 小 于 100 且 本 交易 日 的 J 
值 大 于 10， 或 者 在 数值 在 80 之 上 K 线 下 穿 D 线 〈 即 出 现 死 叉 ) 。 

本 节 的 calKDJSellPoints.py 范例 程序 是 根据 9.4.2 小 节 的 calKDJBuyPoints.py 范例 程序 改写 而 
成 ， 具 体 来 说 ， 增 加 一 个 “计算 卖点 ”命令 按钮 ， 新 增 的 代码 如 下 。 


二 def PrintSel1Points () : 

stockCode=stockCodeVal .get () 

3 startDate=startDateVal .get () 

4 endDate=endDateVal .get () 

5 filename='D:\\stockData\ch9\\' +stockCode+ startDate+endDate+' .csv' 

6 getStockDataFromAPI (stockCode, startDate, endDate) 

nh df = pd.read csv(filename,encoding='gbk') 

8 stockDf = calKDJ (df) 

9 cnt=0 

10 sellDate="'' 

br while cnt<=len (stockDf)-1: 

2 if (cnt>=5) : ## 略 过 前 几 天 的 误差 

1 # 规则 1: 前 一 天 了 值 小 于 100， 当 天 J 值 大 于 100， 是 卖点 

14 if stockDf.iloc[cnt]['J']>100 and stockDf.iloc[cnt-1]['J']<100: 

下 号 sellDate=sellDatetstockDf.iloc[cnt]['Date'] + ',"' 

16 cnt=cnt+1 

17 continue 

18 # 规则 2: K,D 均 在 80 之 上 ， 出 现 K 线 下 穿 D 线 的 死 叉 现象 

LE9 if stockDf.iloc[cnt] ['K']<stockDf.iloc[cnt]['D'] and 
stockDf.iloc[cnt-1] ['D']<stockDf.iloc[cnt-1] ['K']: 

20 # 满足 上 穿 条 件 后 再 判断 K 和 D 均 大 于 80 

21 if stockDf.iloc[cnt]['K']> 80 and stockDf.iloc[cnt]['D']>80: 

22 sellDate = sellDate + stockDf.iloc[cnt]["Date'] + ',"' 

23 cnt=cnt+1 

24 tkinter.messagebox.showinfo(' 提 示 卖 点 ', sellDate) 


25 tkinter.Button (win,text=' 计 算 卖点 ' ,width=12，, 

command=printSellPoints) .place (x=300, y=80) 

在 第 24 行 中 新 增 了 “计算 卖点 ”的 命令 按钮 ， 该 按钮 触发 的 处 理 方法 就 是 第 1 行 到 底 24 行 
所 定义 的 printSellPoints 方法 。 

printSellPoints 方法 与 之 前 的 printBuyPoints 方法 在 结构 上 很 相似 ， 在 第 14 行 到 第 17 行 的 证 
语句 中 ， 实 现 了 基于 本 数值 的 卖 出 策略 ， 即 前 一 个 交易 日 的 丁 值 小 于 100 而 当日 大 于 100。 在 第 
19 行 到 第 22 行 的 让 条 件 语句 中 实现 了 基于 KD 死 又 的 卖 出 策略 ， 即 在 当日 KD 数值 都 大 于 80 的 
前 提 下 ，K 线 下 穿 D 线 。 在 第 25 行 同样 也 是 通过 弹出 消息 框 的 形式 显示 了 卖点 的 日 期 。 

运行 这 个 范例 程序 ， 在 股票 代码 文本 框 中 输入 600886， 这 次 用 股票 “ 国 投 电力 ”来 验证 ， 随 
后 依次 单 击 “ 绘 制 ” 和 “计算 卖点 ”按钮 ， 即 可 看 到 如 图 9-16 所 示 的 结果 。 
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股票 代码 : 600886 
时 间 :2019-01-01 
结束 时 间 :2019-05-31 


给 制 计算 买点 四 2019-03-22, 2019-04-08, 2019-04-10, 2019-05-27, 
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图 9-16 用 股票 “ 国 投 电力 ”来 验证 KDJ 卖点 策略 
在 表 9-2 中 ， 归 纳 了 对 KDJ 指标 各 卖点 的 分 析 情 况 。 
表 9-2 基于 KDJ 指标 得 到 的 卖点 情况 确认 表 


卖点 日 期 对 卖点 的 分 析 


正确 性 
该 日 指标 大 于 100， 后 市 股价 虽 有 一 定 的 上 涨 ， 但 在 短暂 


该 日 1 指标 大 于 100， 之 后 有 明显 的 下 跌 行情 


该 日 出 现 K 线 下 穿 D 线 的 死 叉 现象 ， 之 后 有 明显 的 下 跌 行 


2019-04-10 情 , 该 下 穿 信号 结合 之 前 4 月 8 日 J 线 过 100 的 信号 , 具有 | 正确 
明显 的 “ 卖 出 ”指导 意义 


该 日 了 指标 大 于 100， 但 之 后 股价 持续 振荡 ， 无 明显 下 跌 


9.5 _ 本章 小 结 


本 章 首先 讲述 了 基于 Tkinter 库 的 GUI 交互 界面 的 开发 ， 包 括 标签 、 文 本 框 、 按 钮 、 下 拉 列 
表 框 、 单 选 框 和 复 选 框 等 控件 的 用 法 ， 并 结合 K 线 图 的 范例 程序 讲述 了 Matplotlib 库 的 对 象 与 


Tkinter 库 的 对 象 整 合 的 方式 。 
之 后 在 讲述 Matplotlib 与 


Tkinter 整合 时 ,本章 用 到 的 范例 程序 是 基于 KDJ 指标 的 , 通过 这 些 


范例 程序 ， 让 读者 进一步 了 解 Tkinter 控件 的 用 法 ， 并 能 掌握 GUI 与 图 形 库 交互 的 技巧 。 
本 章 最 后 验证 了 基于 KDJ 指标 的 交易 策略 ， 在 相关 范例 程序 中 ， 综 合 地 用 到 了 数据 结构 、 
Matplotlib 和 GUI 控件 等 知识 ， 让 读者 从 中 进一步 体会 到 图 形 库 与 GUI 整合 的 优势 。 


第 10 


基于 RSI 范例 程序 实现 邮件 功能 


Python 具有 强大 的 数据 分 析 功 能 , 在 实际 应 用 中 , 在 完成 分 析 后 , 往往 会 通过 smtplib 和 email 
这 两 个 模块 ， 以 邮件 的 形式 发 送 结果 。 在 本 章 中 ， 将 讲述 用 Python 程序 发 送 邮件 的 相关 技巧 ， 包 
括 发 送 附 件 和 发 送 富 文本 格式 邮件 的 方式 。 

本 章 用 到 的 股票 范例 程序 是 基于 RSI 指标 的 (RSI 是 指 相对 强 弱 指标 ) 。 在 讲述 完 该 指标 的 算 
法 和 绘制 方式 后 ， 同 样 会 根据 该 指标 来 计算 买点 和 卖点 ， 不 过 在 本 章 中 ,将 用 邮件 的 方式 发 送 计算 
结果 ， 让 读者 进一步 体会 用 Python 语言 编写 邮件 功能 的 技巧 。 


10.1 ”实现 发 邮件 的 功 全 


SMTP (Simple Mail Transfer Protocol) 也 叫 简单 邮件 传输 协议 , 一 般 都 是 用 这 个 协议 来 发 送 邮 
件 。 在 Python 的 smtplib 库 中 封装 了 SMTP 协议 的 实现 细节 ,通过 调用 这 个 库 提供 的 方法 , 无 需 了 
解 协议 的 底层 ， 就 能 方便 地 发 送 简单 文本 邮件 、 富 文本 格式 的 邮件 以 及 带 附 件 的 邮件 。 


10.1.1 发 送 简单 格式 的 邮件 《无 收 件 人 信息 ) 


在 本 节 中 , 我 们 选用 网 易 163 邮箱 提供 的 SMTP 服务 来 发 送 邮件 ,如果 读者 要 用 新 浪 、QQ 或 
其 他 邮箱 的 SMTP 服务 ， 可 以 依 葫芦 画 标 照 此 改写 即 可 。 

除了 smtplib 库 之 外 ， 和 邮件 相关 的 库 还 有 email， 可 以 通过 它 来 设置 邮件 的 标题 和 正文 ， 这 
两 个 库 都 是 Python 自 带 的 , 无 需 额外 安装 。 在 下 面 的 sendSimpleMail.py 范例 程序 中 将 使 用 smtplib 
和 email 发 送 纯 文本 格式 的 邮件 。 


1 # !/usr/bin/env python 
多 # coding=utf-8 
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import smtplib 


from email.mime .text import MIMEText 


def sendMail (username,pwd,from addr,to addr,msg): 


3 
4 
5 ”# 发 送 邮件 
6 
了 
8 


旋 半 于 时 
smtp = smtplib.SMTP() 

9 smtp.connect ('smtp.163.com') 
10 smtp.login(username, pwd) 
11 smtp.sendmail (from addr,to addr, msg) 
be smtp.quit() 
3 except Exception as e: 
14 Print (str(e)) 
15 ”# 组 织 邮件 
16 message = MIMEText ('Python 邮件 发 送 测 试 '，'plain'，"'utf-8') 
17 message['Subject'] = 'Hello, 用 Python 发 送 邮 件 ' 
18 


sendMail('hsm computer','xxx','hsm computer@163.com', 


'hsm computer@163.com',message.as_string()) 


在 第 3 行 和 第 4 行 中 导入 了 发 送 邮件 需要 的 两 个 库 ， 在 第 6 行 到 第 14 行 的 sendMail 方 法 中 ， 
首先 在 第 8 行 创 建 了 smtp 对象 , 并 通过 第 9 行 和 第 10 行 的 程序 代码 登录 到 网 易 163 邮箱 的 SMTP 
服务 器 : smtp.163.com， 其 中 在 第 10 行 的 login 方法 中 , 需要 传 入 登录 所 用 的 用 户 名 和 密码 。 这 里 ， 
读者 需要 改写 范例 程序 ， 填 入 自己 邮箱 的 SMTP 服务 器 以 及 登录 名 和 密码 。 

登录 完成 后 ， 是 通过 调用 第 11 行 的 sendmail 方法 发 送 邮件 ， 其 中 的 前 两 个 参数 分 别 代表 邮件 
的 发 送 者 和 接收 者 ,第 三 个 参数 是 邮件 对 象 ,发 送 完 成 后 , 需要 通过 第 12 行 的 程序 语句 断 开 和 SMTP 
服务 器 的 连接 。 由 于 在 发 送 邮 件 时 可 能 出 现 网 络 等 问题 ， 因 此 这 里 用 try.….except 从 句 来 接收 并 捕 


获 异 常 。 


在 第 18 行 中 通过 调用 sendmail 方法 来 发 送 邮 件 ， 其 中 前 两 个 参数 表示 登录 网 易 163 邮箱 所 用 
到 的 用 户 名 和 密码 , 第 三 个 和 第 四 个 参数 表示 发 送 者 和 接收 者 , 范例 程序 中 的 这 条 程序 语句 其 实 是 


自己 发 自己 收 。 

在 第 16 行 和 第 17 行 中 定 
义 了 sendmail 方法 的 第 五 个 参 
数 ， 即 邮件 对 象 。 在 第 16 行 中 
创建 了 邮件 对 象 MIMEText, 其 
中 第 一 个 参数 表示 邮件 的 正文 
内 容 ， 第 二 个 参数 表示 是 纯 文 
本 ,第 三 个 参数 表示 文本 的 编码 
方式 ， 在 第 17 行 中 则 定义 了 邮 
件 的 标题 。 

运行 这 个 范例 程序 后 ， 即 
可 在 163 邮箱 里 看 到 所 发 送 的 
邮件 ， 如 图 10-1 所 示 ， 其 中 邮 
件 标题 和 邮件 正文 就 由 上 述 代 
码 所 设置 。 


163 


士 收 信 


牧 件 荐 


网 易 免费 邮 


mail163.com ] 


了 红旗 邮件 
全 待 办 邮件 
三 智能 标签 
星 标 联系 人 邮件 


草稿 箱 
己 发 送 
订阅 邮件 


10-1 


区 写 信 


收 件 箱 


考 拉 海 购 


回复 | 回复 全 部 “| 转发 ~ 


Hello, 用 Python 发 送 邮 件 真 户 生 局 


我 -hsm_computer@163.com> 
图 【 支 招 】 如何 高 效 的 沟通 ， 快 速 拿 下 订单 ? 


Python 邮件 发 送 测试 


网 易 163 邮箱 接收 到 的 纯 文本 邮件 


hsm_computer@163.com v 国 | 二 版 | 


网 易 严 选 


HEvp | 各 
无 主题 


删除 | 举报 


立即 升级 >> 
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本 例 使 用 网 易 163 邮箱 的 SMTP 服务 器 发 送 邮件 ， 如 果 要 用 其 他 常用 邮箱 的 SMTP 服务 器 地 
址 ， 请 参考 表 10-1。 


表 10-1 常用 邮箱 的 SMTP 服务 器 一 览 表 


邮箱 SMTP 服务 器 


smtp.sina.com 


Smtp.qq.com 
126 邮箱 smtp.126.com 


10.1.2 发送 HTML 格式 的 邮件 〈 显 示 收 件 人 ) 


在 10.1.1 小 节 发 送 的 邮件 是 纯 文 本 格式 ,在 下 面 的 sendMailWithHtml.py 范例 程序 中 将 在 邮件 
正文 内 引入 html 元 素 。 在 图 10-1 中 , 可 以 看 到 收 件 人 为 空 , 在 本 节 的 范例 程序 中 将 解决 这 个 问题 。 
# !/usr/bin/env Python 
# coding=utf-8 
import smtplib 
from email.mime.text import MIMEText 
# 发 送 邮 件 
def sendMail (username,pwd,from addr,to addr,msg): 

# 程序 代码 和 sendSsimpleMail .py 范例 程序 中 的 程序 代码 一 样 
HTMLContent = '<html><head></head><body>'\ 
'<hl>Hello</hl>This is <a href="https://www.cnblogs.com/JavaArchitect/">My 
Blog.</a>'\ 
10 '</body></html>' 
11 message = MIMEText (HTMLContent, ‘'html', 'utf-8') 
12 message['Subject'] = 'Hello, 用 Python 发 送 邮 件 ' 
13 message['From'] = 'hsm computer' # 邮件 上 显示 的 发 件 人 
14 message['To'] = 'hsm computerQ@163.com' # 邮件 上 显示 的 收 件 人 
15 sendMail('hsm computer','xxx','hsm computer@163.com', 'xxx', 
message.as_string()) 


这 个 范例 程序 中 也 用 到 sendSimpleMail.py 范例 程序 中 的 sendMail 方法 ， 由 于 该 方法 的 程序 代 
码 在 这 两 个 范例 程序 中 完全 一 致 ， 因 此 不 再 重复 说 明 。 

第 8 行 到 第 10 行 其 实 是 一 条 语句 ,由 于 比较 长 ,所 以 用 “\” 符 号 表示 分 行 编写 ,在 HTMLContent 
变量 中 放置 了 基于 HTML 的 邮件 正文 ， 其 中 包含 了 一 个 超 链接 文本 元 素 。 

由 于 邮件 正文 的 格式 是 HTML， 因 此 第 11 行 在 定义 MIMEText 类 型 的 message 对 象 时 ， 第 二 
个 参数 不 是 plain' 〈 纯 文本 格式 ) 而 是 'html (HTML 格式 ) 。 

在 第 13 行 中 通过 message['From'] 属 性 重 写 了 发 件 人 信息 ， 在 第 14 行 是 通过 To 属性 重 写 了 收 
件 人 信息 ， 请 注意 这 两 行 仅仅 用 于 显示 ， 邮 件 的 真正 发 件 人 和 收 件 人 还 是 需要 通过 sendMail 方法 
中 调用 的 smtp.sendmail(from_addr,to_addr, msg) 方 法 ， 由 其 中 的 第 一 个 和 第 二 个 参数 来 指定 。 

其 他 的 程序 代码 没有 变动 ， 还 是 在 第 12 行 通过 Subject 定义 邮件 标题 ， 通 过 第 15 行 调用 
sendMail 方法 发 送 邮件 ， 该 方法 的 第 5 个 参数 依然 是 message.as_string()。 

运行 这 个 范例 程序 之 后 ， 在 网 易 163 邮箱 里 就 能 收 到 如 范例 程序 中 代码 所 定义 的 邮件 ， 如 图 


ownamwmwwn 
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10-2 所 示 。 单 击 邮件 中 的 链接 后 , 即 可 进入 到 目标 页 面 。 请 注意 , 由 于 在 程序 中 通过 message['From'] 
和 message['Tol] 设 置 了 用 于 显示 的 发 件 人 和 收 件 人 信息 ， 所 以 与 图 10-1 相 比 ， 图 10-2 中 的 发 件 人 
和 收 件 人 两 栏 的 值 有 所 改变 。 


返回 回复 | 回复 全 部 v| 转发 ~|| 删除 | 举报 | 标记 为 ~ 


Hello, 用 Python 发 送 邮 件 同方 辕 S 


"hsm_computer” <><> 


我 hsm_computei 3.com> 


~w 江浙 沪 周边 洲际 酒店 大 促 了 284 起 立即 出 发 


Hello 


Thisis My Blog. 
10-2 ”网易 163 邮箱 接收 到 的 HTML 格式 的 邮件 


10.1.3 ”包含 本 文 附件 的 邮件 (多 个 收 件 人 ) 


附件 是 邮件 的 可 选项 ,在 下 面 的 sendMailWithCsvAttachment.py 范例 程序 中 , 将 示范 如 何在 邮 
件 中 包含 文本 附件 ， 在 该 范例 程序 中 ， 还 将 演示 如 何 把 邮件 同时 发 送 给 多 个 收 件 人 。 


# !/usr/bin/env python 

# coding=utf-8 

import smtplib 

from email.mime.text import MIMEText 

from email.mime.multipart import MIMEMultipart 

# 发 送 邮 件 

def sendMail (username,pwd,from addr,to addr,msg): 

# 程序 代码 和 sendsimpleMail .py 范例 程序 中 的 一 样 

HTMLContent = '<html><head></head><body>'\ 
0 '<hl>Hello</hl>This is <a href="https://www.cnblogs.com/JavaArchitect/">My 
Blog.</a>'\ 
'</body></html>' 
message = MIMEMultipart () 
body = MIMEText (HTMLContent, ‘html', ‘'utf-8') 
message.attach (body) 
message['Subject'] = 'Hello, 用 Python 发 送 邮 件 ' 
message['From'] = "hsm_computere163.com' # 邮件 上 显示 的 收 件 人 
message['To'] ='hsm computerQ@163.com,153086207@qq.com' # 邮件 上 显示 的 发 件 人 
file = MIMEText (open('D:\\stockData\\ch9\\6008862019-01-012019-05-31.csv', 
'rb') .read(), 'plain', ‘'utf-8°') 
file['Content-Type'] = "application/text' 
file['Content-Disposition'] = 'attachment;filename="stockInfo.csv"' 
message.attach (file) 


PoaAWNOp 


pppppppp 
oaowm 必 wb 


IN IN 
Pow 
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22 sendMail('hsm computer','xxx','hsm computer@163.com', 

['hsm computer@163.com', '153086207@qq.com'],message.as_ string()) 

由 于 要 发 送 附件 ， 因 此 需要 导入 第 5 行 的 库 ， 第 7 行 sendMail 方法 的 程序 代码 和 之 前 范例 程 
序 中 sendMail 方法 的 程序 代码 完全 一 致 ， 故 而 不 再 说 明 。 

在 第 12 行 中 ,为 了 发 附件 ,所 以 设置 的 邮件 正文 对 象 是 MIMEMultipart 类 型 , 而 不 是 MIMEText 
类 型 。 第 13 行 的 邮件 正文 内 容 和 之 前 html 格式 邮件 的 正文 内 容 完全 一 致 ， 但 这 里 需要 调用 第 14 
行 的 attach 方法 放 入 邮件 message 对 象 。 

在 第 15 行 和 第 16 行 代码 中 分 别 设置 了 用 于 显示 的 邮件 发 件 人 和 收 件 人 信息 ， 请 注意 ， 虽 然 
在 第 16 行 中 通过 message['To'] 属 性 设置 了 两 个 收 件 人 ， 但 如 果 不 修 改 第 22 行 的 代码 ， 即 sendMail 
方法 的 第 四 个 表示 收 件 人 的 参数 依然 只 有 一 个 邮箱 地 址 的 话 ， 这 封 邮 件 还 是 只 会 发 到 一 个 地 址 。 

由 于 是 文本 格式 的 附件 ， 因 此 在 第 18 行 中 用 MIMEText 格式 的 对 象 接收 了 指定 路 径 下 的 csv 
文件 。 在 第 19 行 中 通过 Content-Disposition 属性 指定 了 附件 的 文件 名 ， 在 第 20 行 中 通过 attach 方 
法 把 附件 放 入 message 对 象 。 

请 注意 第 22 行 sendMail 方法 的 第 4 个 参数 , 该 参数 对 应 于 如 下 smtp.sendmail 方法 语法 的 第 2 
个 参数 ， 表 示 收 件 人 ， 该 参数 已 经 被 修改 成 [hsm_computer@163.com','153086207@qq.com']， 表 示 
本 邮件 将 向 两 个 邮箱 发 送 ， 邮 箱 之 间 用 逗号 分 隔 。 

smtp.sendmail (from addr,to addr, msg) 


运行 这 个 范例 程序 之 后 ， 在 网 易 163 邮箱 里 就 能 看 到 如 图 10-3 所 示 的 带 附 件 的 邮件 ， 同 时 请 
注意 收 件 人 栏 中 显示 了 两 个 邮箱 地 址 ， 而 且 另 一 个 QQ 邮箱 也 能 收 到 同样 的 带 附件 的 邮件 。 

再 次 说 明 一 下 ， 这 里 是 通过 smtp.sendmail(from_addrto_addr, msg) 方 法 中 的 to_addr 参数 把 邮 
件 发 送 到 两 个 邮箱 ， 而 message['To] 属 性 中 的 两 个 邮箱 仅仅 是 用 来 显示 。 


《 返回 回复 | 回复 全 部 v| 转发 “|| 删除 | 举报 | 标记 为 ~ 


Hello, 用 Python 发 送 邮件 有 目 广 时 SS 
我 <hsm_computer@163.com> 


我 <hsm_computer@163.com> 153086207<153086207@qq.com> 


+t 牙 《 国 | stockinfo.csy ) 查看 附件 


ww 江浙 沪 周 边 洲际 酒店 大 促 半 284 起 立即 出 发 


Hello 


Thisis My Blog. 
图 10-3 网 易 163 邮箱 接收 到 的 带 文本 附件 的 邮件 


10.1.4 在 正文 中 人 藤 入 图 片 


如 果 用 类 似 10.1.3 小 节 中 范例 程序 的 方法 ， 则 还 可 以 引入 图 片 格式 的 附件 ， 在 下 面 的 
sendMailWithPicAttachment.py 范例 程序 中 ， 将 再 进一步 演示 除了 携带 图 片 附件 外 ， 还 将 在 邮件 正 
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文中 以 html 的 方式 显示 图 片 。 


1 # !/usr/bin/env python 

2 # coding=utf-8 

a import smtplib 

4 from email.mime.text import MIMEText 

5 from email.mime.image import MIMEImage 

6 from email.mime.multipart import MIMEMultipart 

7 “# 发 送 邮件 

8 def sendMail (username,pwd,from addr,to addr,msg): 
9 让 EYE 

10 smtp = smtplib.SsMTP() 

LL smtp.connect ('smtp.163.com') 

smtp.login (username, pwd) 

3 smtp.sendmail (from addr,to addr, msg) 

14 smtp.quit() 

15 except Exception as e: 

16 print (str(e)) 

17 HTMLContent = '<html><head></head><body>'\ '<hl>Hello</hl>This is <a 


href="https://www.cnblogs.com/JavaArchitect/">My Blog.</a>'\ '<img 
src="cid:picAttachment"/>'\ '</body></html>"' 
18 message = MIMEMultipart() 
19 body = MIMEText (HTMLContent, 'htm1'， 'utf-8') 
20 message.attach (body) 
21 message['Subject'] = 'Hello, 用 Python 发送 邮件 ' 
22 message['From'] = 'hsm_computere163.com' # 邮件 上 显示 的 发 件 人 
23 message['To'] ='hsm computerQ@163.com,153086207@qq.com' # 故意 显示 两 个 收 件 人 
24 imageFile = MIMEImage (open('D:\\stockData\\chl0\\picAttachement.jpg', 
'rb') .read()) 
25 imageFile.add header('Content-ID', ‘'picAttachment') 
26 imageFile['Content-Disposition'] = 
'attachment;filename="picAttachement .jpg"' 
27 message.attach (imageFile) 
28 sendMail('hsm computer','xxx','hsm computer@163.com', 
'hsm_ computer@163.com',message.as_string()) 


在 第 23 行 中 虽然 通过 message[To"] 属 性 设置 了 两 个 收 件 人 ， 但 在 第 28 行 的 sendMail 方法 的 
第 4 个 参数 里 ， 还 是 只 放置 了 一 个 收 件 人 ， 也 就 是 说 ， 在 第 13 行 sendmail 方法 的 to_addr 参数 中 
也 只 包含 了 一 个 收 件 人 , 在 运行 范例 程序 之 后 ， 会 发 现 只 有 hsm_computer@163.com 邮箱 收 到 了 邮 
件 ， 而 QQ 邮箱 并 没有 收 到 ， 由 此 可 知 ，message['To] 属 性 仅仅 是 用 来 显示 。 

这 里 的 做 法 其 实 是 先 把 图 片 当成 邮件 的 附件 ， 随 后 在 正文 html 中 通过 img 标签 来 显示 图 片 。 

有 具体 而 言 , 在 第 17 行 的 HTMLContent 变量 中 ,增加 了 一 段 话 :'<img sre="cid:picAttachment"/>'， 
用 img 标签 来 显示 图 片 ， 其 中 cid 是 固定 写法 ， 而 cid 冒号 后 面 的 picAttachment 需要 和 第 25 行 中 
设置 的 Content-ID 属性 值 完 全 一 致 ， 否 则 图 片 将 无 法 正确 显示 。 

由 于 上 传 的 是 图 片 附件 ,因此 在 第 24 行 是 用 MIMEImage 对 象 来 容纳 本 地 图 片 ， 如 前 文 所 述 ， 
在 第 25 行 中 是 通过 add_header 方法 设置 图 片 附件 的 Content-ID 属性 值 。 

运行 这 个 范例 程序 之 后 ， 即 可 看 到 如 图 10-4 所 示 的 结果 ， 其 中 收 件 人 一 栏 中 有 两 个 邮箱 地 址 
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(实际 上 只 向 网 易 163 邮箱 发 送 了 ) ， 而 且 图 片 显示 在 正文 中 。 


16 网 易 免 费 邮 hem_computer@163 com wv 国手 机 新 ， 升 策 VIp | 升 针 最 半 | 设 羡 已 
maill163.com 
Hello, 用 Pyt... Helo, 用 Pyt... 
西 收 信 站 写 信 | ci 四 |[ 回复 | 回复 2 部 ~| 转发 ~|[ 删除 | 举报 | 村 为 v | 移动 到 v| 更 多 
Hello, 用 Python 发 送 郎 件 质 记 自己 
红 这 邮件 我 hsm_computer@163.com> 
图 传 办 邮件 我 hsm_computer@163.com> 153086207<153086207@qq.com> 
三 智 角 村 答 有 9 = 
星 标 联系 人 邮件 
~ 全 问 看 悦 97 县 云 端 用 餐 4 送 式 午餐 站 288 立即 预定 >> 
草 向 村 
已 发 送 
订阅 邮件 Hello 
其 他 5 个 文件 夫 
已 到 除 
ly 局 易 免 费 起 ham_compurerels3com ~ 三 
垃 极 昭 件 mall-163.com 
吉 户 满 出 信 
Sent 抽 路 信 四 写 全 [< ][ | Bas | 他 去] [到 了 | 宗 扣 | 
邮件 标 答 了 
Hello, 用 Python 发 送 邮 件 中 三 自习 
邮箱 中 心 tp % Py 1 
文件 中 心 © Wir 
邮箱 附 件 a a a 
2 1 (soon ET] 
| 
国 4 浊 gkqytt。 六 天 和 多 
5 于 六 雹 庆 已 已 发 过 
秒杀 / 拼 团 /限时 购 订阅 闻 件 H 
4 xsQ0JO/ ello 
Ee 其 他 5 个 立 人 
ee This is My Blog. 


10.2 


图 10-4 网 易 163 邮箱 接收 到 的 正文 中 包含 图 片 的 邮件 


以 邮件 的 形式 发 送 RSI 指标 图 


RSI 指标 也 叫 相对 强 弱 指标 (Relative Strength Index, 简称 RSI) ， 是 由 威 尔 斯 . 魏 尔 德 (Welles 
Wilder) 于 1978 年 首创 ， 发 表 在 他 所 写 的 《技术 交易 系统 新 思路 》 一 书 中 。 

该 指标 最 早 应 用 于 期 货 交 易 中 ， 后 来 发 现 它 也 能 指导 股票 投资 ， 于 是 就 应 用 于 股市 。 在 本 节 
中 ， 先 讲述 RSI 指标 的 算法 ， 再 用 邮件 的 形式 发 送 调用 Matplotlib 库 绘 制 出 来 的 RSI 指标 图 。 


10.2.1 ”RSI 指标 的 原理 和 算法 描述 


相对 强 弱 指标 “RSI) 是 通过 比较 某 个 时 段 内 股价 的 涨 跌幅 度 来 判断 多 空 双方 的 强 弱 程度 ， 以 
此 来 预测 未 来 走势 。 从 数值 上 看 ， 它 体现 出 某 股 的 买卖 力量 ， 所 以 投资 者 能 据 此 预测 未 来 价格 的 走 


势 ， 在 实际 应 用 中 ， 通 常 与 移动 平均 线 配 合 使 用 ， 以 提高 分 析 的 准确 性 。 
RSI 指标 的 计算 公式 如 下 所 示 。 


RS 相对 强度 ) = N 日 内 收盘 价 涨 数 和 的 均值 = N 日 内 收盘 价 跌 数 和 的 均值 
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RSI (相对 强 弱 指 标 ) = 100 一 100 = (1+RS) 


请 注意 , 这 里 “均值 ”的 计算 方法 可 以 是 简单 移动 平均 (SMA), 也 可 以 是 加 权 移动 平均 (WMA) 
和 指数 移动 平均 (EMA ) ， 本 书 采用 的 是 比较 简单 的 简单 移动 平均 算法 ， 有 些 股票 软件 采用 的 是 
后 两 种 平均 算法 。 采 用 不 同 的 平均 算法 会 导致 RSI 的 值 不 同 ， 但 趋势 不 会 改变 ， 对 交易 的 指导 意 
义 也 不 会 变 。 

以 6 日 RSI 指标 为 例 ， 从 当日 算 起 向 前 推算 6 个 交易 日 ， 获 取 到 包括 本 日 在 内 的 7 个 收盘 价 ， 
用 每 一 日 的 收盘 价 减 去 上 一 交易 日 的 收盘 价 ， 以 此 方式 得 到 6 个 数值 ， 这 些 数 值 中 有 正 有 负 。 随 后 
再 按 如 下 四 个 步骤 计算 RSI 指标 。 

GJo up =6 个 数字 中 正 数 之 和 的 平均 值 。 

人 2 down= 先 取 6 个 数字 中 负数 之 和 的 绝对 值 ， 再 对 绝对 值 取 平 均值 。 

本 303 RS =up 除 以 down，RS 表示 相对 强度 。 

304 RSI ( 相对 强 弱 指 标 ) =100 一 100 = (1+RS 


如 果 再 对 第 四 步 得 出 的 结果 进行 数学 变换 ， 能 进一步 约 去 RS 因素 ， 得 到 如 下 的 结论 : 
RSI =100 xX (up)= (uptdown) 


也 就 是 说 ，RSI 等 于 “100 乘 以 up” 除 以 “up 与 down 之 和 ”。 

从 本 质 上 来 看 ，RSI 反映 了 某 阶 段 内 〈 比 如 6 个 交易 日 内 ) 由 价格 上 涨 引发 的 波动 占 总 波动 的 
百分比 率 ， 百 分 比 越 大 ,说 明 在 这 个 时 间 段 内 股票 越 强 势 ， 反之 如 果 百 分 比 越 小 ， 则 说 明 在 这 个 时 
间 段 内 股票 越 弱势 。 

从 上 述 公 式 可 知 ，RSI 的 值 介 于 0 到 100 之 间 ， 目 前 比较 常见 的 基准 周期 为 6 日 、12 日 和 24 
日 ， 把 每 个 交易 日 的 RSI 值 在 坐标 图 上 的 点 连 成 曲线 ， 即 能 绘制 成 RSI 指标 线 ， 也 就 是 说 ， 目 前 
沪 深 股市 中 RSI 指标 线 是 由 三 根 曲 线 构 成 。 


10.2.2 ”通过 范例 程序 观察 RSI 的 算法 
下 面 以 600584( 长 电 科技 ) 股票 为 例 , 计算 它 从 2018 年 9 月 3 日 开始 的 6 日 RSI 指标 ， 在 表 
10-2 中 ， 列 出 了 针对 每 个 交易 日 收盘 价 的 上 涨 和 下 跌 情 况 。 


表 10-2 计算 RSI 的 中 间 过 程 表 
当日 收盘 价 ”| 当日 上 涨 值 


2018-9-3 


[1 | 2018-94 
|2> | 20189-5 
|3 | 2018-96 

| 2018-9-7 


2018-9-10 
2018-9-11 
2018-9-12 
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6 日 RSI 指标 应 该 从 9 月 11 号 开始 算 起 ， 从 该 日 向 前 推 6 个 交易 日 ,得 到 包括 9 月 11 日 在 内 
的 7 个 收盘 价 ， 在 此 基础 上 计算 。 


ET) 从 表 10-2 中 可 以 看 到 ， 从 9 月 11 日 算 起 ( 含 本 日 ) 前 6 日 收盘 价 上 涨 数值 之 和 是 
0.32+ 0.11 = 0.43， 取 平均 值 后 是 0.43 除 以 6， 结 果 为 0.0717。 

ER2 从 9 月 11 日 算 起 ,前 6 日 收盘 价 下 跌 数 值 之 和 是 0.37+ 0.01+ 0.25+ 0.76= 1.39， 取 
平均 值 后 是 0.2317。 
03 RS =up 除 以 down， 即 0.0717 除 以 0.2317， 保 留 两 位 小 数 是 0.31。 
G04 RSI=100 - 100* (1+RS )， 结 果 是 23.66。 


也 就 是 说 ，9 月 11 日 的 6 日 RSI 指标 值 是 23.66， 而 9 月 12 日 的 RSI 指标 的 算法 如 下 。 
ERi 从 当日 (9 月 12 日 ) 算 起 前 6 日 收盘 价 上 涨 数值 之 和 是 0.18， 取 平均 值 是 0.03。 
CFT02 从 当日 算 起 ， 前 6 日 收盘 价 下 跌 数 值 之 和 是 1.39， 取 平均 值 是 0.2317。 


G03 RS = 0.03 除 以 0.2317， 保留 两 位 小 数 是 0.13。 
G04 RSI=100 - 100* (1+RS )， 结果 是 11.46。 


10.2.3 把 Matplotlib 绘制 的 RSI 图 存 为 图 片 


在 下 面 的 DrawRSI.py 范例 程序 中 ， 将 根据 上 述 算法 绘制 600584 (长 电 科技 ) 股票 从 2018 年 
9 月 到 2019 年 5 月 间 的 6 日 、12 日 和 24 日 的 RSI 指标。 
本 范例 程序 使 用 的 数据 来 自 csv 文件 ， 而 该 文件 的 数据 来 自 网 站 的 股票 接口 , 相关 内 容 可 阅读 
之 前 的 章节 。 在 本 范例 程序 中 ， 还 会 把 由 Matplotlib 生成 的 图 形 存储 为 png 格式， 以 方便 之 后 用 邮 
件 的 形式 发 送 。 
1 # !/usr/bin/env Python 
全 # coding=utf-8 
2 import pandas as pd 
4 import matplotlib.pyplot as plt 
5 ”# 计算 RSI 的 方法 ， 输 入 参数 periodList 传 入 周期 列表 
6 def calRSsI (df,periodList): 
7 # 计算 和 上 一 个 交易 日 收盘 价 的 差 值 
8 dfr'diff'] = df["Close"]-df["Close"] .shift(1) 


9 df['diff'] .fillna(0, inplace = True) 

10 df['up'] = df['diff'] 

11 # 过 滤 掉 小 于 0 的 值 

2 df['up'] [df['up']<0] = 0 

3 df['down'] = df['diff'] 

14 # 过 滤 掉 大 于 0 的 值 

15 df['down'] [df['down']>0] = 0 

16 # 通过 for 循环 ， 依 次 计算 periodList 中 不 同 周期 的 RSI 等 值 

Ly for period in PeriodList: 

18 df['upAvg'+str (Period)] = df['up'] .rolling (period) .sum()/period 
19 df['upAvg'+str (period)] .fillna(0, inplace = True) 
20 df['downAvg'+str (period)] = 


abs (df['down'] .rolling (period) .sum() /period) 


194 “| “基于 股票 大 数据 分 析 的 Python 入 门 实 战 ( 视频 教学 版 ) 


ai df['downAvg'+str (Period)].fillna(0，inplace = True) 

22 df['RSI'+str (period)] = 100 - 100/((df['upAvg'+str(period)] / 
df['downAvg'+str (Period)]+1) ) 

Ek return df 


第 6 行 定义 了 用 于 计算 RSI 值 的 calRSI 方法 ， 该 方法 第 一 个 参数 是 包含 日 期 收盘 价 等 信息 的 
DataFrame 类 型 的 df 对象， 第 二 个 参数 是 周期 列表 。 

在 第 8 行 中 把 本 交易 日 和 上 一 个 交易 日 收盘 价 的 差价 存 入 了 "diff 列表 ， 这 里 是 用 shift(1) 来 
获取 df 中 上 一 行 〈 即 上 一 个 交易 日 ) 的 收盘 价 。 由 于 第 一 行 的 diff 值 是 NaN， 因 此 需要 用 第 9 行 
的 fillna 方法 把 NaN 值 更 新 为 0。 

在 第 11 行 中 在 df 对 象 中 创建 了 up 列 ， 该 列 的 值 暂时 和 diff 值 相同 ， 有 正 有 负 ， 但 马上 就 通 
过 第 12 行 的 dtrup'][dftrup]<0] = 0 把 up 列 中 的 负 值 设置 成 0， 这 样 一 来 ，up 列 中 就 只 包含 了 “N 
日 内 收盘 价 的 涨 数 ”。 在 第 13 行 和 第 15 行 中 ， 用 同样 的 方法 ， 在 df 对 象 中 创建 了 down 列 ， 并 
在 其 中 存 入 了 “N 日 内 收盘 价 的 跌 数 ”。 

随后 是 通过 第 17 行 的 for 循环 ， 遍 历 存 储 在 periodList 中 的 周期 对 象 ， 其 实 是 下 面 第 26 行 的 
代码 ， 可 以 看 到 计算 RSI 的 周期 分 别 是 6 天 、12 天 和 24 天 。 

针对 每 个 周期 ， 先 是 在 第 18 行 算出 了 这 个 周期 内 收盘 价 涨 数 和 的 均值 ， 并 把 这 个 均值 存 入 df 
对 象 中 的 'upAvg'+str(period) 列 中 ， 比 如 当前 周期 是 6， 那 么 该 涨 数 的 均值 是 存 入 dfT'upAvg6"] 列 。 
在 第 20 行 中 算出 该 周期 内 的 收盘 价 跌 数 的 均值 ， 并 存 入 "downAvg'+str(period) 列 中 。 最 后 在 第 22 
行 算出 本 周期 内 的 RSI 值 ， 并 放 入 df 对 象 中 的 'RST+str(period) 中 。 

24 filename='D:\\stockData\ch10\\6005842018-09-012019-05-31.csv' 
25 df = pd.read csv(filename,encoding='gbk') 

26 list = [6,12,24] # 周期 列表 

27 # 调用 方法 计算 RSI 


28 stockDataFrame = calRSI (df,1ist) 

29 # print(stockDataFrame) 

30 ”# 开始 绘图 

31 plt.figure() 

32 stockDataFrame['RSI6'] .plot (color="blue",label='RSI6') 

33 stockDataFrame['RSI12'] .plot (color="green",1label='RSI12') 

34 stockDataFrame['RSI24'] .plot(color="purple",label='RSI24') 

35 plt.legend(1loc='best') # 绘 制图 例 

36 ”# 设置 x 轴 坐 标的 标签 和 旋转 角度 

37 major index=stockDataFrame.index[stockDataFrame.index%10==0] 
38 major xtics=stockDataFrame['Date'] [stockDataFrame.index%10==0] 
39 plt.xticks (major index,major xtics) 

40 plt.setp(plt.gca().get xticklabels(), rotation=30) 

41 ”# 带 网 格 线 ， 且 设置 了 网 格 样式 

42 plt.grid(linestyle='-.') 

43 plt.title ("RSI 效果 图 ") 

44 plt.rcParams['font.sans-serif']=['"'SimHei'"] 

45 plt.savefig('D:\\stockData\ch10\\6005842018-09-012019-05-31.png') 
46 plt.show() 


在 第 25 行 从 指定 csv 文件 中 获取 包含 日 期 收盘 价 等 信息 的 数据 , 并 在 第 26 行 指 定 了 三 个 计算 
周期 。 在 第 28 行 调用 了 calRSI 方法 计算 了 三 个 周期 的 RSI 值 ， 并 存 入 stockDataFrame 对 象 ， 当 前 
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第 29 行 的 输出 语句 是 注释 掉 的， 在 取消 注释 后 ， 即 可 查看 计算 后 的 结果 值 ， 其 中 包含 upAvg6、 
downAvg6 和 RSI6 等 列 。 

在 得 到 RSI 数据 后 ， 从 第 31 行 开始 绘图 ， 其 中 比较 重要 的 步骤 是 第 32 行 到 第 34 行 的 程序 代 
码 ， 调 用 plot 方法 绘制 三 根 曲 线 ， 随 后 在 第 35 行 调用 legend 方法 设置 图 例 ， 执 行 第 37 行 和 第 38 
行 的 程序 代码 设置 x 轴 刻 度 的 文字 以 及 旋转 效果 ， 第 42 行 的 程序 代码 用 于 设置 网 格 样式 ， 第 43 
的 程序 代码 用 于 设置 标题 。 

在 第 46 行 调用 show 方法 绘图 之 前 ， 执 行 第 45 行 的 程序 代码 调用 savefig 方法 把 图 形 保存 到 
了 指定 目录 ， 请 注意 这 条 程序 语句 需要 放 在 show 方法 之 前 ， 否 则 保存 的 图 片 就 会 是 空 的 。 

运行 这 个 范例 程序 之 后 ， 即 可 看 到 如 图 10-5 所 示 的 RSI 效果 图 。 需 要 说 明 的 是 ， 由 于 本 范例 
程序 在 计算 收盘 价 涨 数 和 均值 和 收盘 价 跌 数 和 均值 时 , 用 的 是 简单 移动 平均 算法 , 因此 绘制 出 来 的 
图 形 可 能 和 一 些 股票 软件 中 的 不 一 致 ， 不 过 趋势 是 相同 的 。 另 外 ,在 指定 的 目录 中 可 以 看 到 该 RSI 
效果 图 以 png 格式 存储 的 图 片 。 


RSI 效 果 图 
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图 10-5 RSI 指标 效果 图 


10.2.4 ”RSI 整合 K 线 图 后 以 邮件 形式 发 送 


在 本 节 的 DrawKwithRSI.py 范例 程序 中 将 完成 如 下 三 个 工作 : 


(1) 计算 6 日 、12 日 和 24 日 的 RSI 值 。 

(2) 绘制 K 线 、 均 线 和 RSI 指标 图 ， 并 把 结果 保存 到 png 格式 的 图 像 文 件 中 。 
(3) 发 送 邮件 ， 并 把 png 图 片 以 富 文本 的 格式 显示 在 邮件 正文 中 。 

# !/usr/bin/env Python 

# coding=utf-8 

import pandas as pd 

import matplotlib.pyplot as plt 


心 w N 
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3 from mpl finance import candlestick2 ochl 

6 from matplotlib.ticker import MultipleLocator 

import smtplib 

8 from email.mime.text import MIMEText 

9 from email.mime.image import MIMEImage 

10 from email.mime.multipart import MIMEMultipart 

11 # 计算 RSI 的 方法 ， 输 入 参数 periodList 传 入 周期 列表 

12 def calRSI (df,periodList): 

到 # 程序 代码 和 DrawRSI.PY 范例 程序 中 的 程序 代码 一 致 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 


从 第 3 行 到 第 10 行 的 程序 语句 导入 了 相关 的 库 文件 ， 第 12 行 定义 的 calRSI 方 法 和 本 章 前 面 
与 RSI 相关 的 各 范例 程序 中 的 calRSI 方 法 完全 一 致 ， 故 略 去 不 再 重复 说 明了 。 


14 filename='D:\\stockData\chl10\\6005842018-09-012019-05-31.csv' 

15 df = pd.read csv(filename,encoding='gbk') 

16 list = [6,12,24] # 周期 列表 

17 ”# 调用 方法 计算 RSI 

18 stockDataFrame = calRSI(df,1ist) 

19 figure = Plt.figure() 

20 ”# 创建 子 图 

21 (axPrice, axRSI) = figure.subplots(2, sharex=True) 

22 ，# 调用 方法 ， 在 axPrice 子 图 中 绘制 K 线 图 

23 candlestick2 ochl (ax = axPrice, opens=df["Open"] .values, 
closes=df["Close"] .values, highs=df["High"] .values, 
lows=df["Low"] .values,width=0.75, colorup='red', colordown='green') 

24 axPrice.set_title("K 线 图 和 均线 图 ")  # 设置 子 图 标题 

25 stockDataFrame['Close'] .rolling (window=3) .mean() .plot (ax=axPrice, 
color="red", label='3 日 均线 ') 

26 stockDataFrame['Close'] .rolling (window=5) .mean() .plot (ax=axPrice, 
color="blue", label='5 日 均线 ') 

27 stockDataFrame['Close'] .rolling (window=10) .mean() .plot (ax=axPrice, 
color="green", label='10 日 均线 ') 

28 axPrice.legend(loc='best') # 绘制 图 例 

29 axPrice.set_ylabel ("价格 (单位 : 元) ") 

30 axPrice.grid(linestyle='-.') # 带 网 格 线 

31 # 在 axRSI 子 图 中 绘制 RSI 图 形 

32 stockDataFrame['RSI6'] .plot (ax=axRSI,color="blue",1label='RSI6') 

33 stockDataFrame['RSI12'] .plot (ax=axRSI,color="green",label='RSI12') 

34 stockDataFrame['RSI24'] .plot (ax=axRSI,color="purple",label='RSI24') 

35 plt.legend(1loc='best') # 绘 制图 例 

36 plt.rcParams['font.sans-serif']=['SimHei'] 


37 axRSI.set title("RSI 图 ") # 设置 子 图 的 标题 
38 axRSI.grid(linestyle='-.') # 带 网 格 线 


39 # 设置 x 轴 坐标 的 标签 和 旋转 角度 

40 major index=stockDataFrame.index[stockDataFrame.index%7==0] 
41 major xtics=stockDataFrame['Date'] [stockDataFrame.index%7==0] 
42 plt.xticks (major index,major xtics) 

43 plt.setp(plt.gca() .get xticklabels(), rotation=30) 

44 plt.savefig('D:\\stockData\ch10\\600584RSI.png') 


在 第 18 行 中 通过 调用 calRSI 方法 得 到 了 三 个 周期 的 RSI 数据 。 在 第 21 行 设置 了 axPrice 和 
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axRSI 这 两 个 子 图 共享 的 x 轴 标 签 , 在 第 23 行 中 绘制 了 K 线 图 , 从 第 25 行 到 第 27 行 绘制 了 3 日 、 

5 日 和 10 日 的 均线 ， 从 第 32 行 到 第 34 行 绘制 了 6 日 、12 日 和 24 日 的 三 根 RSI 指标 图 。 在 第 44 

行 通过 调用 savefig 方法 把 包含 K 线 、 均 线 和 RSI 指标 线 的 图 形 存储 到 指定 目录 中 。 

45 ”# 发 送 邮件 

46 def sendMail (username,pwd,from addr,to addr,msg): 

47 # 和 之 前 sendMai1lWithPicAttachment .py 范例 程序 中 的 一 致 ， 请 参考 本 书 提供 下 载 的 完整 范 
例 程 序 


48 def buildMail (HTMLContent, subject,showFrom,showTo,attachfolder, 


attachFileName): 
49 message = MIMEMultipart () 
50 body = MIMEText (HTMLContent, ‘html', "utf-8') 
message.attach (body) 
2 message['Subject'] = subject 
33 message['From'] = showFrom 
54 message['To'] = showTo 
5 imageFile = MIMEImage (open (attachfoldertattachFileName, 'rb') .read()) 
56 imageFile.add header('Content-ID', attachFileName) 
= imageFile['Content-Disposition'] = 
'attachment;filename="'+tattachFileNamet'™""' 
58 message.attach (imageFile) 
59 return message 


第 46 行 定义 的 sendMail 方法 和 本 章 之 前 各 范例 程序 中 的 sendMail 方法 完全 一 致 ， 故 略 去 不 
再 重复 说 明了 。 本 范例 程序 与 本 章 之 前 范例 程序 的 不 同 之 处 是 ， 在 第 48 行 中 专门 定义 了 buildMail 
方法 ， 用 来 组 装 邮件 对 象 ， 邮 件 的 诸多 元 素 由 该 方法 的 参数 所 定义 。 有 具体 而 言 ， 在 第 49 行 中 定义 
的 邮件 类 型 是 MIMEMultipart， 也 就 是 说 对 于 带 附 件 的 邮件 ， 在 第 50 行 和 第 51 行 中 根据 参数 
HTMLContent 构建 了 邮件 的 正文 ， 从 第 52 行 到 第 54 行 的 程序 语句 设置 了 邮件 的 相关 属性 值 ， 从 
第 55 行 到 第 57 行 的 程序 语句 根据 输入 参数 构建 了 MIMEImage 类 型 的 图 片 类 附件 ， 在 第 58 行 中 
通过 调用 attach 方法 把 附件 并 入 邮件 正文 。 
60 ， subject='RSI 效果 图 ' 
61 attachfolder='D:\\stockData\\ch10\\"' 
62 attachFileName="'600584RSI.png' 
63 HTMLContent = '<html><head></head><body>'\ 
64 '<img src="cid:'+tattachFileName+'"/>'\ 
65 '</body></html>"' 
66 message = buildMail (HTMLContent, subject,'hsm computer@163.com', 

'hsm computer@163.com',attachfolder,attachFileName) 
67 sendMail('hsm computer','xxx','hsm computer@163.com', 

'hsm computer@163.com',message.as_string()) 
68 ”# 最 后 再 绘制 
69 plt.show() 


从 第 60 行 到 第 66 行 的 程序 语句 设置 了 邮件 的 相关 属性 值 , 并 在 第 66 行 中 通过 调用 buildMail 
方法 创建 了 邮件 对 象 message, 在 第 67 行 中 通过 调用 sendMail 方法 发 送 邮件 ， 最 后 在 第 69 行 通过 
Show 方法 绘制 了 图 形 。 本 范例 程序 中 的 3 个 细节 需要 注意 。 


(1) 第 64 行 cid 的 值 需要 和 第 56 行 的 Content-ID 值 一 致 ， 否 则 图 片 只 能 以 附件 的 形式 发 送 ， 
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而 无 法 在 邮件 正文 内 以 富 文本 的 格式 显示 。 

(2) 先 构建 并 发 送 邮件 ， 再 通过 第 69 行 的 代码 绘制 图 形 ， 如 果 次 序 颠 倒 ， 先 绘制 图 形 后 发 
送 邮件 的 话 ， 那 么 show 方法 被 调用 后 程序 会 阻塞 在 这 个 位 置 ， 无 法 继续 执行 。 要 等 到 手动 关 掉 由 
show 方法 弹出 的 窗口 后 ， 才 会 触发 sendMail 方法 发 送 邮 件 。 

(3) 在 本 范例 程序 的 第 48 行 ， 专 门 封装 了 用 于 构建 邮件 对 象 的 buildMail 方法 ， 在 该 方法 中 
通过 参数 动态 地 构建 邮件 ， 如 此 以 来 ,如果 要 发 送 其 他 邮件 ， 则 可 以 调用 该 方法 ， 从 而 可 以 提升 代 
码 的 重用 性 。 

运行 这 个 范例 程序 之 后 ， 即 可 在 弹出 的 窗口 中 看 到 K 线 、 均线 和 RSI 指标 图 整合 后 的 效果 图 ， 
而 且 可 以 在 邮件 的 正文 内 看 到 相同 的 图 ， 如 图 10-6 所 示 。 

RSI 效 果 图 由 Pe 


点 件 人 ， 我 dhsm_computer@163.com: 


我 hsm_computer@163.com 
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图 10-6 包含 K 线 、 均 线 和 RSI 指标 图 的 邮件 


10.3 ”以 邮件 的 形式 发 送 基 于 RSI 指标 的 买卖 点 


本 节 会 讲述 基于 RSI 指标 的 常用 买卖 交易 策略 ， 并 通过 Python 程序 实现 并 验证 相关 策略 。 本 
节 给 出 的 买卖 点 日 期 将 通过 邮件 的 形式 发 出 。 
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10.3.1 RSI 指标 对 买卖 点 的 指导 意义 


一 般 来 说 , 6 日 、12 日 和 24 日 的 RSI 指标 分 别称 为 短期 、 中 期 和 长 期 指标 。 和 KDJ 指标 一 样 ， 
RSI 指标 也 有 超 买 区 和 超 卖 区 。 

具体 而 言 ， 当 RSI 值 在 50 到 70 之 间 波 动 时， 表示 当前 属于 强势 状态 ， 如 继续 上 升 ， 超 过 80 
时 ， 则 进入 超 买 区 ， 极 可 能 在 短期 内 转 升 为 跌 。 反 之 RSI 值 在 20 到 50 之 间 时 ， 说 明 当前 市 场 处 
于 相对 弱势 ， 如 下 降 到 20 以 下 ， 则 进入 超 卖 区 ， 股 价 可 能 出 现 反弹 。 

在 讲述 RSI 交易 策略 之 前 ， 先 来 讲述 一 下 在 实际 操作 中 总 结 出 来 的 RSI 指标 的 缺陷 。 


(1) 周期 较 短 (比如 6 日 ) 的 RSI 指标 比较 灵敏 ， 但 快速 震荡 的 次 数 较 多 ， 可 靠 性 相对 差 些 ， 
而 周期 较 长 (比如 24 日 ) 的 RSI 指标 可 靠 性 强 ， 但 灵敏 度 不 够 ， 经 常会 “滞后 ”的 情况 。 

〈2) 当 数 值 在 40 到 60 之 间 波 动 时， 往往 参考 价值 不 大 ， 有 具体 而 言 ， 当 数值 向 上 突破 50 临 
界 点 时 ， 表 示 股 价 已 转 强 ， 反 之 向 下 跌 破 50 时 则 表示 转 弱 。 不 过 在 实践 过 程 中 ， 经 常会 出 现 RSI 
跌 破 50 后 股价 却 不 下 跌 ， 以 及 突破 50 后 股价 不 涨 


综合 RSI 算法 、 相 关 理 论 以 及 缺陷 ， 下 面 再 来 讲述 一 下 实际 操作 中 常用 的 基于 该 指标 的 买卖 
策略 。 


(1) RSI 短期 指标 〈6 日 ) 在 20 以 下 超 卖 区 与 中 长 期 RSI (12 日 或 24 日 ) 发 生 黄金 交叉 
即 6 日 线 上 穿 12 日 或 24 日 线 , 则 说 明 即将 发 生 反 弹 行情 , 如 果 参 照 其 他 技术 指标 或 政策 面 等 方面 
没有 太 大 问题 的 话 ， 可 以 适当 买 进 。 

(2) 反之 ，RSI 短期 指标 〈6 日 ) 在 80 以 上 超 买 区 与 中 长 期 RSI (12 日 或 24 日 ) 发 生死 亡 
交叉 , 即 6 日 线 下 穿 12 日 或 24 日 线 , 则 说 明 可 能 会 出 现 高 位 反 转 的 情况 ， 如 果 没 有 其 他 利好 消息 
等 ， 可 以 考虑 卖 出 。 


10.3.2 ”基于 RSI 指标 计算 买点 并 以 邮件 的 形式 发 出 


根据 10.3.1 小 节 的 描述 ， ee RSI 的 买点 策略 是 ，RSI6 日 线 在 20 以 下 与 中 长 期 
RSI (12 日 或 24 日) 发 生 了 黄金 交 

在 下 面 的 calRSIBuyPoints.py re 据 此 策略 计算 600584 (长 电 科 技 ) 从 2018 年 9 月 
到 2019 年 5 月 间 的 买点 ， 并 通过 邮件 发 送 买点 日 期 。 


# !/usr/bin/env Python 
# coding=utf-8 
import pandas as pd 
import smtplib 
from email.mime.text import MIMEText 
from email.mime.image import MIMEImage 
from email.mime.multipart import MIMEMultipart 
# 计算 RSI 的 方法 ， 输 入 参数 periodList 传 入 周期 列表 
def calRSI(df,PeriodList) : 
0 # 和 DrawRSI.PY 范例 程序 中 的 一 致 ， 省 略 相关 代码 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 


Poowawm 必 wm 
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return df 

12 filename='D:\\stockData\ch10\\6005842018-09-012019-05-31.csv' 
13 df = pd.read csv(filename,encoding="'gbk') 

14 list = [6,12,24] # 周期 列表 

15  # 调用 方法 计算 RSI 

16 stockDataFrame = calRSI (df,1ist) 


从 第 3 行 到 第 7 行 的 程序 语句 通过 import 语句 导入 了 相关 库 ， 第 9 行 定义 的 calRSI 方法 和 本 
章 之 前 各 范例 程序 中 的 calRSI 方法 一 致 ， 故 略 去 不 再 说 明了 。 在 第 13 行 通过 读 取 csv 文件 得 到 了 
包括 开盘 价 、 收 盘 价 、 日 期 等 的 股票 交易 数据 ， 在 第 16 行 调 用 calRSI 方法 后 ，stockDataFrame 对 
象 中 除了 包含 从 csv 文件 中 读 取 的 股票 数据 外 ， 还 包含 了 RSI6、RSI12 和 RSI24 的 相关 数据 。 
17 cnt=0 
18 buyDate=' 


19 while cnt<=len(stockDataFrame) -1: 


20 if (cnt>=30) :# 前 几 天 有 误差 ， 从 第 30 天 算 起 


2 WE 

22 # 规则 1: 这 天 RSI 6 的 值 低 于 20 

| if stockDataFrame.iloc[cnt]['RSI6']<20: 

24 # 规则 2.1: 当天 RSI6 上 穿 RSI12 

25 if stockDataFrame.iloc[cnt]['RSI6']>stockDataFrame. 


iloc[cnt] ['RSI12'] and stockDataFrame.iloc[cnt-1] ['RSI6']<stockDataFrame. 
zloc[cnt=1] ['RSI12°']: 


26 buyDate = buyDate+stockDataFrame.iloc[cnt]['Date'] + ',' 
27 # 规则 2.2: 当天 RSI6 上 穿 RSI24 
28 if stockDataFrame.iloc[cnt]['RSI6']>stockDataFrame. 


iloc[cnt] ['RSI24'] and stockDataFrame.iloc[cnt-1] ['RSI6'] < stockDataFrame. 
iloc[lent=1] [RSTI24"]s 


29 buyDate = buyDate+stockDataFrame.iloc[cnt]['Date'] + ',"' 
30 except: 

3 Pass 

32 cnt=cnt+1 


33 Pprint (buyDate) 


在 第 19 行 的 while 循环 中 ， 按 交易 日 逐 天 遍历 了 stockDataFrame 对 象 ， 由 于 存在 误差 ， 因 此 
过 滤 掉 了 前 30 个 交易 日 的 数据 。 

在 第 22 行 的 证 语句 中 ， 制 定 了 第 一 个 规则 ， 即 当天 RSI6 的 值 小 于 20， 在 满足 这 个 条 件 的 前 
提 下 ， 再 尝试 第 25 行 和 第 29 行 的 证 条 件 。 

在 第 25 行 中 制定 的 过 滤 规 则 是 当天 RSI6 的 值 上 穿 RSI12 形成 金 又, 即 当日 RSI6 大 于 RSI12， 
前 一 个 交易 日 RSI6 小 于 RSI12。 在 第 28 行 制定 的 过 滤 规 则 是 当日 RSI6 上 穿 RSI24 形成 金 叉 。 注 
意 ， 第 25 行 和 第 28 的 让 条 件 属于 “或 ”的 关系 。 

本 轮 次 的 while 循环 结束 后 ， 通 过 第 33 行 的 打印 语句 ， 就 能 看 到 保存 在 buyDate 对 象 中 的 买 
点 日 期 。 

34 def sendMail (username,pwd,from addr,to addr,msg): 
35 # 和 之 前 DrawKwithRSI .py 范例 程序 中 的 一 致 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 


36 def buildMail (HTMLContent, subject,showFrom,showTo,attachfolder, 
attachFileName) : 
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3 # 和 之 前 DrawKwithRSI .py 范例 程序 中 的 一 致 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 

38 subject='RSI 买点 分 析 ' 

39 attachfolder='D:\\stockData\\ch1l0\\"' 

40 attachFileName="'600584RSI .png' 

41 HTMLContent = '<html><head></head><body>'\ 

42 ' 买 点 日 期 ' + buyDate + \ 

43 '<img src="cid:'+tattachFileName+'"/>'\ 

44 '</body></html>' 

45 message = buildMail (HTMLContent, subject,'hsm computer@163.com', 
'hsm computer@163.com',attachfolder,attachFileName) 

46 sendMail('hsm computer','xxx','hsm computer@163.com', 
'hsm computer@163.com',message.as_ string()) 


在 第 34 行 中 定义 了 封装 发 邮件 功能 的 sendMail 方法 ， 在 第 36 行 中 定义 了 封装 构建 邮件 功能 
的 buildMail 方法, 这 两 个 方法 和 本 章 前 面 各 范例 程序 中 的 同名 方法 完全 一 致 ,因此 不 再 重复 说 明 。 

从 第 41 行 到 第 44 行程 序 语句 中 的 HTMLContent 对 象 里 定义 了 邮件 的 正文 ， 其 中 通过 第 42 
行 的 程序 代码 在 正文 内 引入 了 买点 日 期 , 在 第 43 行 引入 了 这 个 时 间 范 围 内 的 K 线 、 均 线 和 RSI 指 
标 图 。 最 后 通过 第 46 行 的 程序 代码 调用 sendMail 方法 发 送 邮 件 。 

运行 这 个 范例 程序 之 后 ， 即 可 收 到 如 图 10-7 所 示 的 邮件 , 在 其 中 就 能 看 到 买点 日 期 和 指标 图 。 


K 线 图 和 均线 图 


一 38 均 颖 
— 5 
一 一 10 昌 均线 


买点 日 期 2018-12-19,2019-01-02, 
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从 执行 结果 可 知 ， 得 到 的 买点 日 期 是 2018-12-19 和 2019-01-02， 其 中 ， 在 2018-12-19 之 后 的 
交易 日 里 ， 股 价 有 上 涨 ， 但 涨幅 不 大 ， 不 过 至 少 有 出 货 的 机 会 ， 而 在 2019-01-02 之 后 的 若干 交易 
日 内 ， 股 价 有 显著 上 涨 。 
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10.3.3 ”基于 RSI 指标 计算 卖点 并 以 邮件 的 形式 发 出 


在 下 面 基于 RSI 指标 计算 卖点 的 calRSISellPoints.py 范例 程序 中 , 采用 的 策略 是 , RSI6 日 线 在 
80 以 上 与 中 长 期 RSI (12 日 或 24 日 ) 发 生死 叉 ， 用 于 分 析 的 股票 依然 是 600584〈 长 电 科 技 ) ， 
时 间 段 依然 是 2018 年 9 月 到 2019 年 5 月 之 间 ， 计 算出 的 卖点 日 期 也 是 通过 邮件 发 送 。 


# !/usr/bin/env Python 

# coding=utf-8 

import pandas as pd 

import smtplib 

from email.mime.text import MIMEText 

from email.mime.image import MIMEImage 

from email.mime.multipart import MIMEMultipart 
# 计算 RSI 的 方法 ， 输 入 参数 periodList 传 入 周期 列表 
def calRSsI (df,periodList): 

# 和 DrawRSI .py 范例 程序 中 的 一 致 ， 省 略 相关 代码 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
filename='D:\\stockData\ch10\\6005842018-09-012019-05-31.csv' 
df = pd.read csv(filename,encoding='gbk') 
list = [6,12,24] # 周期 列表 
# 调用 方法 计算 RSI 
stockDataFrame = calRSI(df,1ist) 


在 第 15 行 中 通过 调用 calRSI 方法 计算 RSI 指标 值 ， 这 部 分 程序 代码 和 10.3.2 小 节 的 
calRSIBuyPoints.py 范例 程序 中 的 相关 代码 非常 相似 ， 故 而 不 再 重复 说 明了 。 
16 cnt=0 
17 sell1Date=' 
18 while cnt<=len(stockDataFrame)-1: 


19 if (cnt>=30): # 前 几 天 有 误差 ， 从 第 30 天 算 起 


FFPioowamwmcewmbP 
上 口 
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DL 
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20 trys 

2 # 规则 1: 这 天 RSI6 高 于 80 

22 if stockDataFrame.iloc[cnt]['RSI6']<80: 

3 # 规则 2.1: 当天 RSI6 下 穿 RSI12 

24 if stockDataFrame.iloc[cnt]['RSI6']<stockDataFrame. iloc[cnt] 
['RSI12'] and stockDataFrame.iloc [cnt-1] ['RSI6']>stockDataFrame.iloc[cnt-1] 
Duero 

25 sellDate = sellDatetstockDataFrame.iloc[cnt]['Date’'] + ',"' 

26 # 规则 2.2: 当天 RSI6 下 穿 RSI24 

学 if stockDataFrame.iloc[cnt]['RSI6']<stockDataFrame. iloc[cnt] 
['RSI24'] and stockDataFrame.iloc[cnt-1] ['RSI6']>stockDataFrame.iloc[cnt-1] 
['RSI24']: 

28 if sellDate.index(stockDataFrame.iloc[cnt]['Date']) == -1: 

2 sellDate = Sel1Date+stockDataFrame.iloc[cnt]['Date'] + ',"' 

30 except: 

3 pass 

3 这 cnt=cnt+1 


33 print(sellDate) 
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在 第 18 行 到 第 32 行 的 while 循环 中 ， 计 算 了 基于 RSI 的 卖点 ， 在 第 22 行 的 程序 语句 中 制定 


了 第 一 个 规则 : RSI6 数值 大 于 80。 第 23 行 和 第 27 行 的 程序 语句 是 在 规则 1 的 基础 上 制定 了 两 个 
并 行 的 子规 则 。 通过 这 些 程序 代码 , 在 sellDate 对 象 中 就 存储 了 RSI6 大 于 80 并 且 RSI6 下 穿 RSI12 
(或 RSI24) 的 那个 交易 日 ， 这 些 交 易 日 即 为 卖点 。 


def sendMail (username,pwd,from addr,to addr,msg): 

# 和 之 前 calRSIBuyPoints .py 范例 程序 中 的 完全 一 致 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
def buildMail (HTMLContent, subject, showFrom, showTo,attachfolder, 
attachFileName) : 

# 和 之 前 cal1RSIBuyPoints .py 范例 程序 中 的 完全 一 致 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
subject='RSI 卖点 分 析 ' 
attachfolder='D:\\stockData\\ch10\\"' 
attachFileName="'600584RSI .png' 

HTMLContent = '<html><head></head><body>'\ 

' 卖 点 日 期 ' + sellDate + \ 

"<img src="cid:'+tattachFileNamet+'"/>'\ 

"</body></html>' 
message = buildMail (HTMLContent, subject, 'hsm computer@163.com', 
'hsm computerQ@163.com',attachfolder,attachFileName) 
sendMail('hsm computer','xxx','hsm computer@163.com', 
'hsm_computer@163.com',message.as_string()) 


第 34 行 和 第 36 行 中 的 两 个 用 于 发 送 邮 件 和 构建 邮件 的 方法 与 本 章 前 面 的 各 范例 程序 中 同名 


的 方法 完全 一 致 ， 故 略 去 不 再 额外 说 明了 。 


在 第 38 行 中 定义 的 邮件 标题 是 “RSI 卖点 分 析 ”, 在 第 41 行 定义 的 描述 正文 的 HTMLContent 


对 象 中 存放 的 也 是 “卖点 日 期 ”， 最 终 是 在 第 46 行 调用 sendMail 方法 通过 邮件 发 送出 去 。 


运行 这 个 范例 程序 之 后 ， 即 可 看 到 如 图 10-8 所 示 的 邮件 ， 其 中 包括 了 卖点 日 期 和 指标 图 。 本 


范例 计算 得 出 的 卖点 日 期 比较 多 ， 经 分 析 ， 这 些 日 期 之 后 ， 股 价 多 有 下 跌 的 情况 。 


RSsI 实 点 分 析 由 户 司 己 


及 不 国 仙 思拓 项 晶 ! 2 首付 出 得 日 反 ax 了 新 


各 日 M2018-10-30.2018-11-12,2018-11-21,2018-12-11,2018-12:21,2019-01-03,2019-01-17.2019-01-29.2019-03-14.2019-04-01,2019-04-10,2019-04-25， 


线 图 和 均线 图 
上 二 
二 sms 
Rh 一 一 108 全 去 
中 
Ee 
Em 


"NN NN NN 
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10.4 本 童 小 结 


在 本 章 的 开始 部 分 ,讲述 了 通过 Python 的 smtplib 和 email 库 发 送 纯 文 本 和 HTML 格式 邮件 的 
用 法 ， 在 此 基础 上 还 讲述 了 发 送 附 件 以 及 在 邮件 正文 内 引入 图 片 的 技巧 。 

之 后 讲述 了 RSI 指标 的 原理 和 计算 方法 ， 以 及 如 何在 邮件 正文 内 以 图 片 的 形式 引入 了 K 线 、 
均线 和 RSI 指标 图 ， 并 通过 范例 程序 示范 了 Python 邮件 编程 的 相关 技巧 。 

在 介绍 完 RSI 的 算法 和 绘制 方法 之 后 ， 照 例 讲述 了 验证 基于 RSI 指标 买点 和 卖点 的 方式 ， 最 
后 通过 邮件 发 送 基于 RSI 指标 的 买点 和 卖点 日 期 。 


用 BIAS 范例 讲述 Django 框架 


在 开发 网 站 时 ， 应 当 更 关注 于 网 站 的 功能 ， 而 不 应 当 过 多 关注 “网 页 底层 功能 的 实现 ”。 比 
如 开发 显示 股票 指标 的 网 站 ， 需 要 更 关注 “显示 哪些 指标 ”之 类 的 功能 ， 而 对 于 “HTTP 服务 器 支 
持 页 面 的 方式 ”以 及 “HTTP 页 面 间 跳 转 方式 ”等 细节 ， 由 于 与 网 站 的 功能 无 关 ， 则 无 需 过 多 关注 。 

Django 框架 能 很 好 地 屏蔽 掉 HTTP 底层 的 细节 ， 从 而 让 开发 者 能 集中 精力 开发 必要 的 功能 。 
更 为 方便 的 是 ， 通 过 Django 框架 提供 的 工具 ， 能 方便 地 搭建 一 个 “原型 ”网 站 ， 开 发 者 就 能 在 此 
基础 上 方便 地 添加 各 种 功能 ， 从 而 构建 一 个 属于 自己 的 网 站 ， 比 如 本 章 将 在 基于 Django 的 原型 网 
站 上 开发 实现 股票 BIAS 指标 的 范 范例 程序 。 


11.1 基于 WSGI 规范 的 Web 编程 


没有 对 比 ， 就 无 法 感受 到 Web 框架 的 优势 ， 所 以 在 介绍 Django 框架 之 前 ， 先 来 看 一 下 基于 
WSGI 规则 的 Web 编程 方式 。 从 中 可 以 感受 到 ， 在 基于 WSGI 规范 的 Web 开发 中 ， 开 发 者 还 需要 
关注 “页 面 交 互 细节 ”这 类 无 法 直接 产生 经 济 价值 的 HTTP 底层 实现 。 


11.1.1 基于 WSGI 规范 的 Python Web 代码 


WSGI 是 Web Server Gateway Interface 的 缩写 ， 中 文 含义 是 服务 器 网 关 接 口 。 它 是 一 个 规范 ， 
通过 该 规范 ，Python 应 用 程序 (或 之 后 提 到 的 框架 ) 可 以 在 HTTP 服务 器 (HTTP Server) 上 运行 。 
下 面 通过 startWSGIServer.py 范例 程序 ， 来 演示 一 下 基于 WSGI 规范 开发 的 Web 项 目的 常规 
方式 。 
1 # !/usr/bin/env Python 
2 # coding=utf-8 
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3 from wsgiref.simple server import make server 

4 def myWebApp (environ, response): 

5 response('200 OK', [('Content-Type', 'text/html')]) 

6 return ['Web Page Created by WSGI.'.encode (encoding='utf 8')] 
7 

8 


# 创建 一 个 服务 器 ， 端 口 是 8080， 用 于 处 理 的 方法 是 myWebApp 
9 httpd = make server('localhost', 8080, myWebApp) 
10 print("Starting HTTP Server on 8080...") 
11 # 监听 HTTP 请 求 ， 如 果 有 请 求 ， 则 调用 myWwebApp 方法 进行 处 理 
12 httpd.serve forever() 

在 第 9 行 中 创建 了 一 个 HTTP 服务 器 ， 它 运行 在 本 地 localhost， 监 听 端 口 是 8080， 在 第 12 行 
中 通过 调用 serve_forever 方法 启动 了 这 个 服务 器 ， 此 后 一 旦 有 请 求 发 往 localhost 的 8080 端口 ， 则 
会 如 第 9 行程 序 语句 所 设置 的 ， 调 用 在 第 4 行 定 义 的 myWebApp 方法 来 处 理 HTTP 请 求 。 

再 来 看 一 下 第 4 行 定 义 的 处 理 HTTP 请 求 的 myWebApp 方法 ， 首 先是 在 第 5 行 返 回 200 状态 
码 ， 表 示 请 求 成 功 ， 随 后 在 第 6 行 返回 一 段 文字 。 请 注意 ， 由 于 是 在 Python 3 环境 中 开发 ， 因 此 
第 6 行 返回 的 文字 还 需要 调用 encode 方法 转换 成 byte 数组 格式 ， 否 则 会 提示 异常 。 

运行 这 个 范例 程序 , 随后 在 浏览 器 中 输入 http://localhost:8080 就 能 看 到 如 图 11-1 所 示 的 画面 ， 
这 说 明 ， 向 localhost 服务 器 8080 端口 发 出 的 请 求 经 myWebApp 方法 处 理 后 ， 成 功 地 返回 了 200 
状态 码 和 一 段 文字 。 


< © 个 http://localhost:8080/ 
D>》 高 收 训 谷歌 店 网 直 大 全 门 360 搜 索 门 游戏 中 心 国 目 crosoft 问 链 接 


Web Page Created by WSGI. 


图 11-1 简单 的 基于 WSGI Web 程序 的 运行 结果 


11.1.2 再 加 入 处 理 GET 请 求 的 功能 


11.1.1 小 节 的 范例 程序 过 于 简单 ， 读 者 无 法 体会 到 WSGI 开发 的 复杂 度 ， 在 下 面 的 
startWSGIServerWithGet.py 范例 程序 中 ， 加 入 了 处 理 GET 请 求 的 功能 ， 可 以 从 中 体会 基于 WSGI 
处 理 稍 微 复杂 一 点 的 HTTP 请 求 的 难度 。 


# !/usr/bin/env python 
# coding=utf-8 
from wsgiref.simple server import make_ server 
def myWebApp (environ, response): 
response('200 OK', [('Content-Type', 'text/html')]) 
method = environ['REQUEST METHOD'] 
Param = environ['PATH INFO'] [1:] 
if method=='GET' : 
body='WSGI Get Demo!' + Param 
return [body.encode (encoding='utf 8')] 


mowaoumewmn 
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Po 
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httpd = make server('localhost', 8080, myWebApp) 
print ("Starting HTTP Server on 8080...") 
httpd.serve forever() 


HR 
A 
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和 11.1.2 小 节 的 startWSGIServer.py 范例 程序 相 比 ， 本 范例 程序 修改 了 处 理 HTTP 请 求 的 
myWebApp 方法 。 在 这 个 方法 的 第 6 行 , 通过 environ[REQUEST_METHOD'] 属 性 得 到 了 HTTP 请 
求 的 方式 ， 在 第 7 行 则 通过 environ['PATH_INFO"[1:] 得 到 了 基于 GET 请 求 的 参数 。 

在 第 8 行 的 证 条 件 判 断 语句 中 ，HTTP 请 求 如 果 是 GET 格式 ， 则 在 body 字符 串 中 加 入 param 
参数 。 启 动 本 范例 程序 之 后 ， 如 果 在 浏览 器 中 输入 http://localhost:8080/Hello 就 能 看 到 如 图 11-2 所 
示 的 结果 。 


本 《 [6 J 1 localhost 
D》 高 收 京 谷歌 站 网 址 大 全 9350 搜索 站 游戏 中 心 回放 crosoft 加 链接 


WSGI Get Demo!Hello 


11-2 WSGI 处 理 GET 请 求 的 结果 


从 HTTP 服务 的 角度 来 看 ，http://localhost:8080/Hello 是 基于 GET 的 请 求 , 而 Hello 则 是 参数 ， 
所 以 在 startWSGIServerWithGet.py 范例 程序 的 第 7 行 中 ，param 变量 其 实 被 赋值 为 “Hello”。 
从 这 个 范例 程序 的 执行 就 能 看 到 基于 WSGI 规范 处 理 GET 请 求 的 步骤 ， 首先 要 获取 请 求 类 型 
(比如 GET), 然后 再 获取 参数 , 随后 再 根据 请 求 类 型 (有 可 能 再 根据 请 求 参数 ), 用 不 同 的 让 ..else 
如 果 在 某 个 程序 项 目 中 ， 需 要 用 GET 类 型 的 参数 区 分 “订单 ”“ 会 员 ” 和 “商品 查询 ”等 不 
同 种 类 的 请 求 ， 并 根据 请 求 执 行 不 同 的 操作 ， 那 么 就 不 得 不 通过 多 个 if...else 语句 来 分 别处 理 ， 如 
果 再 加 上 POST 类 的 HTTP 请 求 , 那么 用 于 处 理 的 程序 代码 将 会 变 得 非常 复杂 , 非常 不 利于 项 目的 
维护 。 对 此 ， 有 必要 在 Web 开发 中 引入 框架 。 


11.2 ”通过 Django 框架 开发 Web 项 目 


在 Python 语言 体系 中 , 有 多 种 不 同 的 Web 框架 , Django 是 其 中 比较 流行 的 一 种 。 通 过 Django 
框架 ， 可 以 方便 地 创建 基于 MVC 的 空白 Web 项 目 。 

由 于 这 个 空白 的 Web 项 目 已 经 很 好 地 封装 了 页 面 跳 转 等 底层 实现 的 细节 ， 因 此 开发 者 可 以 在 
此 基础 上 添加 实现 业务 功能 的 具体 程序 代码 , 从 而 较为 方便 地 构建 实现 具体 功能 的 Web 应 用 程序 。 


11.2.1 安装 Django 组 件 


可 以 用 本 书 前 面 介绍 过 的 pip 命令 安装 Django 框架 组 件 ， 具 体 步骤 是 : 到 包含 有 pip 命令 的 
目录 中 ,运行 pip install django 命令 ,假如 本 机 的 pip 命令 在 D:\Python34\Scripts 目录 中 ,就 先 通过 
cmd 命令 进入 到 “命令 提示 符 ” 窗 口 ， 再 进入 到 此 目录 中 ， 在 其 中 运行 pip install django 命令 。 

上 述 命令 运行 后 , 会 根据 本 机 的 Python 版 本 安装 对 应 的 版 本 ， 安 装 成 功 后 ， 在 “命令 提示 符 ” 
窗口 中 能 看 到 提示 性 文字 ， 还 可 以 通过 运行 如 下 的 djangoDemo.py 程序 来 确认 安装 是 否 成 功 。 

1 # !/usr/bin/env python 
安 import django 
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总 Print (django.get version()) 


其 中 在 第 2 行 导入 了 Django 库 , 在 第 3 行 输出 了 Django 的 版 本 号 ， 如 果 安 装 成 功 ， 那么 运行 
这 段 程序 时 不 会 报错 ， 而 且 会 输出 版 本 号 。 


11.2.2 ”创建 并 运行 Django 


成 功 安装 Django 后 ,在 pip 所 在 的 目录 (本 机 是 Di:\Python34\Scripts ) 就 能 看 到 django-admin.exe 
等 Django 相关 的 程序 ， 在 该 目录 中 运行 django-admin startproject MyDjangoApp 命令 ， 就 能 在 当前 
目录 创建 名 为 MyDjangoApp 的 空白 项 目 。 

创建 完成 后 ,在 MyDjangoApp 目录 中 ， 能 看 到 若干 文件 ， 这 些 文件 的 作用 如 表 11-1 所 示 ，, 其 
中 项 目 名 为 MyDjangoApp。 


表 11-1 Django 项 目 中 各 文件 及 其 作用 一 览 表 


包含 同 该 Django 项 目 进行 交互 的 命令 行 工具 
空 文件 ， 说 明 该 目录 是 一 个 Python 包 


在 该 文件 中 能 设置 当前 项 目的 配置 
在 该 文件 中 能 设置 当前 项 目的 HTTP 映射 关系 
基于 WSGI 规 范 的 当前 项 目的 运行 入 口 


在 wsgi.py 文件 中 ， 可 以 看 到 如 下 的 代码 ， 这 说 明 Django 框架 的 底层 实现 也 是 基于 WSGI 的 。 
虽然 如 此 ， 由 于 对 WSGI 进行 了 封装 ， 在 使 用 Django 开发 时 ， 感 知 不 到 WSGI 规范 的 存在 ， 因 此 
也 不 用 过 多 地 考虑 基于 WSGI 规范 的 跳 转 细节 。 


application = get wsgi application() 


创建 完 Django 项 目 之 后 ， 可 以 把 包含 在 MyDjangoApp 目录 中 的 文件 复制 到 Eclipse 工具 中 ， 
以 方便 后 续 的 开发 和 代码 管理 。 有 具体 步骤 是 ， 首 先 在 Eclipse 中 创建 名 为 MyDiangoApp 的 PyDev 
项 目 ， 请 注意 这 里 的 项 目 名 必须 和 之 前 通过 django-admin 命令 创建 的 项 目 名 保持 一 致 。 随 后 ， 把 
项 目 目录 中 的 manage.py 等 文件 复制 到 Eclipse 中 MyDjangoApp 项 目 中 的 src 目录 下 ， 对 应 的 文件 
目录 层次 关系 如 图 11-3 所 示 。 


由 加 settings. py 
由 加 wls. py 
DB vsei. py 
由 - 回 nanage. py 

由 -二 python3.4.4 MD;\Python34\python exe) 


11-3 ”Django 文件 的 目录 层次 关系 图 
创建 好 上 述 项 目 后 ， 就 可 以 通过 如 下 的 步骤 运行 这 个 空白 的 Django 项 目 。 


人 EXO) 用 鼠标 选中 manage.py 文件 , 单 击 鼠 标 右键 , 在 弹出 的 快捷 菜单 中 依次 选择 “Run As” 
一 “Run Configurations”"， 如 图 11-4 所 示 。 
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- enug Fs 
lone ET + 

日 多 MyDjangoApp Compare With * @ 2 Python unit-test 
日 器 < Replace With 


日 出 MyDja Ri 
由 a lipse 
由 回 邮 Tsm 


由 - 卓 vs Properties 和 t+Enter 
| 


11-4 选中 文件 再 单 击 鼠 标 右键 ， 而 后 依次 选择 菜单 项 


302 在 弹出 的 如 图 11-5 所 示 的 窗口 中 ,切换 到 “Arguments" 选 项 卡 ,在 “Program arguments” 
文本 框 中 输入 “runserver localhost:8080”" ， 再 单 击 “Apply” 按 钮 保存 上 述 修改 ， 最 后 单 击 “Run” 
按钮 启动 程序 。 


Name: NyDjangoApp mansge. py 

前 Main Wr rements BB Interpreter 1 Refresh 天 Enviromment 口 comon 
Program arguments 
runserver localhost:8080 


WM argunents (for python exe or java exe) 


Working directory: 


Onetenlt 1 ro ] 
加 other: ${workspace_loc: NyDjangoApp/ sre} | 
Mply | [Revert 
Bun Close 


11-5 ”设置 启动 参数 


在 上 述 步 又 中 ， 设 置 了 manage.py 程序 的 启动 参数 ， 它 的 效果 等 价 于 如 下 的 命令 ， 其 作用 是 ， 
在 localhost 的 8080 端口 启动 了 基于 Django 框架 的 Web 程序 。 


python manage.py runserver localhost:8080 


启动 程序 后 ， 在 浏览 器 中 输入 localhost:8080， 就 能 看 到 如 图 11-6 所 示 的 Django 默认 页 面 。 


人 合 localhost # 
大全 站 29 要务 广 半 站 必 国 机 omit 站 证 Mr -Or 国 
django View release notes for piango20 
A 
| 
The install worked successfully! Congratulations! 
You are seeing this page because DEBUG=True isin 
your setings file and you have not configured any 
URLSs 


11-6 ”Diango 默认 的 页 面 
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在 表 11-1 中 可 以 看 到 urls.py 文件 中 包含 了 映射 规则 ， 在 其 中 可 以 加 入 自己 定义 的 规则 ， 修 改 
后 的 urls.py 文件 如 下 所 示 。 


from django.contrib import admin 
from django.urls import path 
from . import view 


urlpatterns = [ 

path('admin/', admin.site.urls), 

path('helloworld/', view.myView), 
] 
第 7 行 的 代码 是 新 加 的 ,这 说 明 helloworld 内 容 的 请 求 会 被 view.py 中 的 myView 方法 处 理 过 。 
到 与 urls.py 文件 平行 的 目录 中 创建 view.py 文件 ， 在 其 中 写 入 如 下 的 代码 。 
1 from django.http import HttpResponse 
2 def myView (request): 
3 return HttpResponse("Hello world!") 

在 第 2 行 定 义 的 myView 处 理 方法 中 ， 返 回 如 第 3 行 所 示 的 “Hello world!” 文 字 。 

修改 完 urls.py 并 添加 view.py 文件 后 ， 再 次 启动 manage.py 程序 ， 同 样 带 上 runserver 
localhost:8080 参数 。 此 时 ， 如 果 在 浏览 器 中 输入 http://localhost:8080/helloworld/， 该 请 求 包含 了 
“helloworld” 参 数 ， 所 以 会 命中 如 下 的 url 映射 规则 ， 从 而 被 view.py 文件 中 的 myView 方法 处 理 。 
path('helloworld/', view.myView), 
运行 结果 是 ， 在 浏览 器 中 能 看 到 “Hello world! ”文字 ， 如 图 11-7 所 示 。 


en localhost 
Dp 名 收藏 谷歌 翔 网址 大 全 360 搜 索 游戏 中 心 Microsoft 链接 


oamouwmwwmP 


Hello world! 


图 11-7 自 定义 映射 规则 后 的 运行 结果 


11.2.3 ”从 Form 表单 入 手 扩展 Django 框架 


在 Web 项 目 中 ， 离 不 开 Form 表单 (也 称 为 窗 体 ) ， 因 为 它 是 发 送 GET 和 POST 等 HTTP 请 
求 的 最 常用 元 素 . 在 本 节 中 ,将 在 上 述 MyDjangoApp 项 目的 基础 上 ,通过 增加 实现 登录 功能 的 Form 
表单 来 演示 在 Django 框架 中 实现 基于 MVC 请 求 的 技巧 。 

301 在 与 urlpy 同 级 的 目录 中 ， 新 建 一 个 名 为 templates 的 目录 ， 在 其 中 存放 html 格式 的 
网 页 文件 ， 同 时 ， 在 Django 框架 中 的 settings.py 文件 里 ， 通 过 如 下 的 代码 使 Django 框架 认可 这 个 
目录 ， 这 样 Django 就 会 到 这 个 目录 中 查找 指定 的 html 文件 。 


TEMPLATES = [ 
{ 


2 
| 过 
4 'DIRS': ['MyDjangoApp/templates'], 
5S 
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6 ] 
}, 


修改 了 第 4 行 的 DIRS 属性 ， 在 其 中 添加 了 刚才 新 建 的 templates 目录 ， 否 则 的 话 ， 系 统 会 报 
“无 法 找到 对 应 html 文件 ”之 类 的 错误 。 


人 在 templates 目录 中 ， 新 建 两 个 html 文件 ,分别 是 login.html 和 welcome.html， 其 中 
显示 登录 页 面 的 login.html 代码 如 下 。 


1 <html> 

2 <head> 

3 <title>django login</title> 

4 </head> 

5 <body> 

6 <form name="loginForm" action="/loginAction/" method="POST"> 

| {% csrf token %} 

8 <table> 

9 <tr> 

10 <td>UserName:</td> 

1 <td><input type="text" name="username" id="username" /></td> 

12 </tr> 

13 <tr> 

14 <td>Password</td> 

5 <td><input type="password" name="password" id="password" 
/></td> 

16 </tr> 

这 <tr> 

18 <td colospan="2" align="center"> 

19 <input type="submit" name="logon" value="Login" />&nbsp;é&nbsp; 

20 <input type="reset" name="reset" value="Reset" /> 

总 注 </td> 

22 </tr> 

23 </table> 

24 </form> 

25 </body> 

26 </html> 


在 第 6 行 定义 的 form 中 ， 包 含 了 username 和 password 这 两 个 文本 框 ， 一 旦 用 鼠标 单 击 了 第 19 
行 定义 的 Login 按钮 ， 则 会 按照 第 6 行 action 的 定义 ， 以 POST 的 形式 发 出 /loginAction/ 跳 转 请 求 。 
请 注意 ,在 Django 框架 的 form 中 ， 需 要 加 上 如 第 7 行 所 定义 的 {% csrf_ token %}， 和 否则 跳 转 
时 会 报错 。 而 显示 欢迎 页 面 的 welcome.html 页 面相 对 简单 ， 代 码 如 下 。 
<html> 
<body> 
Welcome, {{ username }} 
</body> 
</html> 
这 里 的 关键 语句 是 在 第 3 行 显示 Welcome 等 文字 , 其 中 {{ usemame }} 表 示 从 其 他 页 面 中 传 来 


的 username 参数 。 


必 wN 
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C303 在 urlspy 中 ， 定 义 各 种 跳 转 操作 ， 代 码 如 下 。 


from django .contrib import admin 

from django.urls import Path 

from django.conf.urls import url 

from . import login 

urlpatterns = [ 
path('admin/', admin.site.urls), 
url('^login/$', login.enterLoginPage), 
url('^loginAction/$', login.loginAction) 

] 


其 中 新 加 的 是 第 7 行 和 第 8 行 语句 ， 在 第 7 行 中 定义 了 一 旦 有 login/ 的 请 求 ， 则 交 由 login.py 
文件 中 的 enterLoginPage 方 法 去 处 理 ,如 果 有 loginAction/ 的 请 求 , 则 由 login.py 文件 中 的 loginAction 
方法 去 处 理 。 

人 4 定义 具体 处 理 跳 转 请 求 的 login.py， 代 码 如 下 。 


ownamumtwn 


1 from django.shortcuts import render 

全 def enterLoginPage (request) : 

3 return render (request， 'login.html') 

4 

5 def loginAction (request): 

6 username = request.POST.get('username') 

7 Password = request.POST.get('password') 

8 if username == 'Django' and password == 'Python': 
9 return render (equest， 'welcome .htm1l1'，{ 
10 "username ' : username 

EE }) 

2 else; 

13 return render(request, 'login.html') 


根据 urls.py 的 定义 , 第 2 行 定义 的 enterLoginPage 方法 用 于 处 理 login/ 格 式 的 请 求 ， 在 其 中 的 
语句 就 是 直接 跳 转 到 login.html 页 面 。 

而 第 5 行 定 义 的 loginAction 方法 用 于 处 理 loginAction/ 格 式 的 请 求 ,在 其 中 的 第 6 行 和 第 7 行 
语句 ， 先 获取 到 以 POST 格式 传 来 的 username 和 password 参数 ， 在 第 8 行 是 通过 了 简单 的 让 语句 
来 进行 身份 验证 ， 如 果 通过 ， 则 执行 第 9 行 的 程序 代码 ， 携 带 username 参数 跳 转 到 welcome.html 
页 面 ， 否 则 执行 第 13 行 的 代码 返回 到 login.html 页 面 。 

由 于 之 前 在 settings.py 的 TEMPLATES 中 设置 了 DIRS 路 径 ， 因 此 login.html 和 welcome.html 
这 两 个 文件 虽然 和 login.py 不 在 同一 个 目录 中 ,但 Django 系统 会 到 DIRS 路 径 中 去 找 。 如 果 没 有 
事先 设置 ， 就 会 报错 。 


11.2.4 ”运行 范例 程序 了 解 基 于 MVC 的 调用 模式 


如 果 按 照 11.2.3 小 节 说 明 的 过 程 编写 完 基于 Diango 框架 的 “登录 ”代码 后 ， 参 照 11.2.2 小 节 讲 
述 的 方式 ， 携 带 runserver localhost:8080 参数 运行 manage.py， 在 本 地 的 8080 端口 监听 HTTP 请 求 。 
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随后 在 浏览 器 中 输入 http://localhost:8080/login/， 根 据 urls.py 中 的 定义 ， 该 请 求 会 由 login.py 
的 enterLoginPage 方法 去 处 理 ， 而 该 方法 会 跳 转 到 login.html 页 面 ， 因 此 会 看 到 如 图 11-8 所 示 的 登 
录 页 面 。 


他 一 合 localhost 
谷歌 说 网 直 大 全 360 搜 索 游戏 中 心 Microsoft 链接 


LBeset, 


11-8 基于 Django 框架 的 登录 页 面 


在 其 中 输入 用 户 名 : Django， 密 码 : Python， 再 单 击 “Login” 按 钮 ， 该 页 面 所 在 的 Form 表单 
会 以 POST 的 格式 , 把 请 求 发 送 到 /loginAction/, 如 urls.py 定义 , 该 请 求 会 由 login.py 的 loginAction 
方法 去 处 理 。 

如 果 用 户 名 和 密码 正确 ， 则 会 携带 usemame 参数 跳 转 到 welcome.html 页 面 ， 如 图 11-9 所 示 。 
如 果 用 户 名 和 密码 不 正确 ， 也 会 由 loginAction 方法 处 理 ， 但 会 跳 转 回 login.html 登录 页 面 。 

< © localhost 
1》 部 收 戈 、 口 人 歌 县 网 站 大 全 站 360 搜 索 口 游 戏 中 必 


Welcome, Django 


图 11-9 通过 身份 验证 后 的 欢迎 页 面 


在 login.html 文件 中 ， 需 要 加 入 {% csrf token %} 代 码 ， 这 是 为 了 防止 CSRF 攻击 ， 从 而 提升 
安全 性 。 只 要 在 Django 框架 中 使 用 form 表单 ， 则 都 需要 加 入 这 段 代 码 。 

如 果 把 这 段 代 码 去 掉 , 重新 运行 manage.py, 再 次 通过 http://localhost:8080/login/ 进 入 登录 页 面 ， 
在 输入 UserName 和 Password 并 单 击 “Login” 按 钮 后 ， 则 会 看 到 如 图 11-10 所 示 的 出 错 页 面 。 


Forbidden (403) 


CSRF verification failed. Request aborted. 


Help 


Reason given for failure: 
CSRF token nissing or incorrect. 


In general, this can occur When there is a genuine Cross Site Request Forgery, or When Diango’ s CSRF mechanil 


。 Your browser is accepting cookies. 

» The view function passes a request to the tenplate’s render nethod. 

。 In the template, there is a {% csrf_token %} template tag inside each POST forn that targets an intern: 

» If you are not using CsrfViesliddlerare, then you must use csrf protect on any views that use the ed 

» The forn has a valid CSRF token. After logging in in another browser tab or hitting the back button 
because the token is rotated after a login. 


Tou re seeing the help section of this page because you have IEBUG = True in your Django settings file。Changd 


You can customize this page using the CSRF_FAILURE_VIEW setting. 


11-10 去掉 {% csrf_token %} 代 码 后 的 错误 提示 页 面 


从 上 述 运 行 流 程 中 ， 可 以 看 到 Django 框架 里 基于 MVC 的 运行 流程 。 
Django 框架 能 容纳 html 等 Web 页 面 来 提供 视图 (View) 的 功能 ， 而 在 urls.py 中 定义 的 跳 转 
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代码 则 承担 了 控制 器 〈Control) 的 功能 ， 也 就 是 可 以 把 视图 端的 请 求 转发 到 对 应 的 处 理 方法 中 ， 
而 提供 业务 功能 的 py 程序 文件 (这 里 是 login.py) 则 承担 了 模型 (Model) 的 效果 ， 因 为 其 中 的 业 
务 处 理 方法 能 返回 经 过 处 理 后 的 业务 结果 模型 。 

正 是 因为 Django 框架 中 的 MVC 三 模块 各 司 其 职 ， 所 以 和 11.1 节 讲 述 的 单纯 基于 WSGI 的 
Web 开发 方式 相 比 ，Django 具有 很 好 的 扩展 性 。 具 体 表现 为 ， 能 通过 “可 维护 ”的 方式 来 扩展 功 
能 ， 而 且 扩展 后 的 代码 可 读 性 非常 好 ， 也 方便 之 后 进一步 的 维护 和 扩展 。 


11.2.5” Django 框架 与 Matplotlib 的 整合 


在 之 前 的 登录 范例 程序 中 模型 (Model) 层 提供 的 welcome.html 页 面 里 ， 显示 的 是 文字 。 由 于 
Web 页 面 难免 需要 显示 图 表 , 因此 本 节 将 在 之 前 MyDjangoApp 范例 程序 的 基础 上 按 如 下 步骤 添加 
一 些 代码 ， 从 而 在 基于 Django 框架 的 页 面 中 增加 Matplotlib 图 形 的 实现 方法 。 

G01 在 urls.py 文件 中 的 urlpatterns 部 分 ， 新 增 一 个 映射 关系 ， 关 键 代码 如 下 。 
from . import viewForMatplotlib 
urlpatterns = [ 


# 省 略 其 他 代码 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
url('^showMatplotlibImg/$', viewForMatplotlib.createMatplotlibImg) 


MawWODOP 


] 

第 4 行 的 规则 做 了 如 下 定义 : showMatplotlibImg 格式 的 请 求 交 由 viewForMatplotlib.py 文件 的 
createMatplotlibImg 方法 去 处 理 ， 而 在 第 1 行 的 import 语句 中 导入 了 对 应 的 处 理 类 。 

人 2? 创建 包含 上 述 处 理 方法 的 viewForMatplotlib.py 文件 ， 具 体 代 码 如 下 。 


#!/usr/bin/env Python 

#coding=utf-8 

from django.shortcuts import render 
import matplotlib.pyplot as plt 
import numpy as np 

import sys 

from io import BytesIO 

import base64 

9 import imp 

10 # 以 上 导入 了 需要 的 类 库 

11 imp.reload(sys) # 解决 导入 类 库 里 可 能 会 有 的 编码 问题 
12 def createMatplotlibImg (request): 


vawm 必 wm 


3 figure = plt.figure() 

14 ax = figure.add subplot (111) 

3 ax.set title('django 整合 matplotlib') 

16 x = np.array([1,2,3,4,5]) 

bt x piou(lse x*xh 

18 plt.rcParams['font.sans-serif']=['SimHei'] 
19 # 把 图 形 保存 为 bytes 格式 ,方便 传输 

20 buffer = BytesIO() 

21 Plt.savefig (buffer) 


22 plt.close() # 关闭 plt 对 象 ， 否 则 下 次 调用 可 能 出 错 
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这 base64img = base64.b64encode (buffer.getvalue () ) 
24 img = "data:image/png;base64,"+tbase64img.decode() 
25 return render (request， 'data.html', { 

26 Am mg 

27 i 


首先 注意 第 11 行 的 代码 ， 在 某 些 Python 编译 器 中 ， 在 Django 框架 内 ， 当 通过 import 语句 导 
入 Matplotlib 等 库 时 ， 可 能 会 报 编码 格式 的 错误 ， 此 时 可 以 通过 这 段 代码 来 解决 。 

在 第 12 行 的 代码 中 定义 了 处 理 请 求 的 createMatplotlibImsg 方法 ， 在 其 中 的 第 13 行 到 第 18 行 
代码 中 ， 通 过 plt 对 象 绘制 了 y=x*x 的 图 形 。 在 第 21 行 通过 调用 savefig 方法 ， 把 包含 在 plt 对 象 
中 的 图 形 存储 到 buffer 这 个 字 节 流 缓存 内 。 第 23 行 和 第 24 行 的 程序 语句 把 图 形 字 节 流 用 base64 
算法 进行 编码 ， 并 在 第 25 行 以 img 参数 的 形式 发 送 到 目标 页 面 data.html。 

这 里 要 注意 两 点 : 第 一 ， 基 于 Matplotlib 的 图 形 是 以 字 节 流 的 形式 发 送 到 目标 页 面 ; 第 二 ,在 
对 容纳 Matplotlib 图 形 的 plt 处 理 完成 后 ， 需 要 如 第 22 行 那样 ,调用 close 方法 关闭 plt 对 象 ， 否 则 
在 刷新 页 面 时 ， 因 为 plt 对 象 没 关闭 ， 所 以 第 二 次 使 用 时 会 出 现 异 常 。 

I03 编写 最 终 显 示 Matplotlib 图 形 的 data.html 页 面 ， 代 码 如 下 。 
<html> 
<head> 
<meta charset="utf-8"> 
</head> 
<body> 
由 Matplotlib 绘制 的 图 形 :<br/> 
<img src="{{ img }}"> 
</body> 
</html> 
如 果 要 在 html 页 面 中 显示 中 文 ， 则 
需要 加 入 第 3 行 的 代码 ， 指定 本 页 面 支持 bb 号 以 案 蔬 歌 且 同 址 大 主 30U 扫 索 游戏 中 心 Mcrosott 链接 
utf-8 格式 ， 否 则 在 某 些 版 本 的 Django 框 Ifatplotlib 绘 制 的 图 形 : 
架 中 会 出 错 。 这 里 显示 图 片 的 关键 语句 在 


omwanuwmewNP 


《 Co | localhost 


django 整 合 natplot1ib 


第 7 行 ， 通 过 接收 createMatplotlibImg 方 站 
法 传 来 的 img 参数 ， 在 html 页 面 的 img 
控件 中 显示 图 片 。 a 


编写 完 上 述 代码 后 ， 同 样 携带 
runserver localhost:8080 参数 运行 
manage.py， 以 启动 本 Django 框架 程序 。 
随后 在 浏览 器 中 输入 


http://localhost:8080/showMatplotlibImg/ ， 5 
就 能 看 到 如 图 11-11 所 示 的 结果 。 从 中 可 
以 看 到 ， 由 Matplotlib 生成 的 图 形 正确 地 CO 


显示 在 Diango 框架 中 的 html 页 面 内 。 11-11 Diango 整合 Matplotlib 图 形 后 的 效果 图 
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11.3 ”绘制 乖 离 率 BIAS 指标 


在 11.2 节 已 经 解决 了 在 Django 框架 中 显示 Matplotlib 图 形 的 技术 难点 ， 在 本 节 中 将 用 股票 分 
析 理 论 中 的 乖 离 率 (BIAS) 来 进一步 示范 Django 框架 的 用 法 。 

乖 离 率 是 根据 之 前 提 到 过 的 葛 兰 由 移 动 均线 八大 法 则 而 衍生 出 来 的 指标 ， 顾 名 思 义 ， 它 是 通 
过 计算 当前 价格 和 移动 平均 线 的 偏离 程度 来 分 析 买 卖 时 间 点 。 


11.3.1 ”BIAS 指标 的 核心 思想 和 算法 


乖 离 率 指 标的 核心 思想 是 ， 当 股价 偏离 移动 平均 线 太 远 时 ， 不 论 是 在 均线 之 上 还 是 之 下 ， 都 
不 会 持续 太 长 时 间 ， 而 且 股 价 随时 会 趋 近 移动 平均 线 。 根 据 这 一 原则 ， 来 介绍 一 下 具体 的 算法 。 

同样 ， 乖 离 率 指标 也 可 以 分 为 日 乖 离 率 指标 、 周 乖 离 率 、 月 乖 离 率 和 年 乖 离 率 ， 股 市 分 析 实 
践 中 经 常用 到 日 乖 离 率 和 周 乖 离 率 ， 本 范例 程序 中 着 重 讲述 日 针 离 率 ， 它 的 计算 方法 如 下 。 


N 日 BIAS= (当日 收盘 价 一 N 日 移动 平均 价 ) * N 日 移动 平均 价 x 100 


在 实践 中 ，N 的 取 值 方式 一 般 有 两 大 种 : 一 种 是 以 5 为 倍数 ， 比 如 5 日 、10 日 和 30 日 等 ， 另 
一 种 是 以 6 为 倍数 ， 比 如 6 日 、12 日 和 24 日 等 。 

虽然 数值 有 所 不 同 ,但 分 析 和 研判 买卖 点 的 思路 差不多 ， 在 本 章 给 出 的 范例 程序 中 , 分 别 用 6 
日 、12 日 和 24 日 代表 短期 、 中 期 和 长 期 乖 离 率 。 


11.3.2 ”绘制 K 线 与 BIAS 指标 图 的 整合 效果 


根据 11.3.1 小 节 介 绍 的 算法 ,在 下 面 的 DrawKwithBIAS.py 范例 程序 中 ,整合 了 KK 线 图 与 BIAS 
指标 图 。 


# !/usr/bin/env Python 

# coding=utf-8 

import pandas as pd 

import matplotlib.pyplot as plt 

from mpl finance import candlestick2 ochl 

# 计算 BIAS 的 方法 ， 输 入 参数 periodList 传 入 周期 列表 

def calBIAS (df,periodList): 
# 遍历 周期 ,计算 6, 12, 24 日 BIAS 

有 for Period in PeriodList: 

10 df['MA'+str (Period)] = df['Close'] .rolling (window=period) .mean() 

df['MA'+str (period)] .fillna(value = df['Close'], inplace = True) 

12 df['BIAS'+str (period)] = (df['Close'] - df['MA'+str (period)])/df['MA'+ 
str (period)]*100 

3 return df 


oamwm 必 wm 
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第 7 行 的 calBIAS 方法 实现 了 计算 BIAS 指标 的 功能 ， 其 中 df 参数 中 包含 了 交易 日 期 收盘 价 


等 股票 交易 数据 ， 而 periodList 参数 中 则 包含 了 BIAS 的 计算 周期 ， 在 调用 时 ， 其 中 包含 了 6，12 
和 24 这 三 个 数值 。 


在 第 9 行 的 for 循环 中 ， 依 次 遍历 了 periodList 参数 ， 在 第 10 行 中 计算 了 当前 周期 (比如 6 


天 ) 的 均 价 ， 由 于 刚 开始 几 天 均 价 是 0， 因 此 在 第 11 行 中 设置 了 这 几 天 的 均 价 为 收盘 价 。 在 第 12 
行 中 根据 了 11.3.1 小 节 给 出 的 公式 计算 了 当前 周期 的 BIAS 值 。 
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filename='D:\\stockData\ch11\\6006402019-01-012019-05-31.csv' 
df = pd.read csv(filename,encoding='gbk') 
list = [6,12,24] # 周期 列表 
# 调用 方法 计算 BIAS 
stockDataFrame = calBIAS (df,1ist) 
# print (stockDataFrame) # 可 以 去 掉 注释 来 查看 结果 
figure = plt.figure() 
# 创建 子 图 
(axPrice, axBIAS) = figure.subplots(2, sharex=True) 
# 调用 方法 ， 在 axPrice 子 图 中 绘制 K 线 图 
candlestick2 ochl (ax = axPrice, 
opens=df["Open"] .values, closes=df["Close"] .values, 
highs=df["High"] .values, lows=df["Low"] .values, 
width=0.75, colorup='red', colordown="'green') 
axPrice.set title("K 线 图 和 均线 图 ")  # 设置 子 图 标题 
stockDataFrame['Close'] .rolling (window=6) .mean() .plot (ax=axPrice, 
color="red", label='6 日 均线 ') 
stockDataFrame['Close'] .rolling (window=12) .mean() .plot (ax=axPrice, 
color="blue", label='12 日 均线 ') 
stockDataFrame['Close'] .rolling (window=24) .mean() .plot (ax=axPrice, 
color="green", label='24 日 均线 ') 
axPrice.legend (loc='best') # 绘制 图 例 
axPrice.set_ylabel ("价格 (单位 : 元 ) ") 
axPrice.grid(linestyle='-.')  # 带 网 格 线 
# 在 axBIRAS 子 图 中 绘制 BIAS 图 形 
stockDataFrame['BIAS6'] .plot (ax=axBIRAS,color="blue",1abel='BIRAS6') 
stockDataFrame['BIAS12'] .plot (ax=axBIAS, color="green", label='BIAS12') 
stockDataFrame['BIAS24'] .plot (ax=axBIAS, color="purple", label='BIAS24') 
plt.legend (loc='best') # 绘制 图 例 
plt.rcParams['font.sans-serif']=['SimHei'] 
axBIAS.set_title ("BIAS 指标 图 ") # 设置 子 图 的 标题 
axBIAS.grid(linestyle='-.') # 带 网 格 线 
# 设置 x 轴 坐 标的 标签 和 旋转 角度 
major_ index=stockDataFrame.index[stockDataFrame.index%5==0] 
major xtics=stockDataFrame['Date'] [stockDataFrame.index%5==0] 
plt.xticks (major index,major xtics) 
plt.setp(plt.gca() .get xticklabels(), rotation=30) 
plt.show() 


第 16 行 设置 了 计算 BIAS 的 周期 ， 分 别 是 6、12 和 24。 在 第 18 行 中 通过 调用 calBIAS 方法 ， 


传 入 包含 指定 600640 股票 数据 的 csv 文件 ， 并 计算 出 该 股票 短 中 长 期 的 BIAS 值 。 


随后 , 通过 第 24 行 的 代码 在 上 部 的 子 图 中 绘制 了 线 图 , 通过 第 29 行 到 第 31 行 的 代码 绘制 
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了 6 日 、12 日 和 24 日 的 均线 ， 这 里 的 均线 周期 和 BIAS 的 周期 保持 一 致 。 

而 在 第 36 行 到 第 38 行 的 代码 中 , 根据 stockDataFrame['BIAS61] 等 数据 ， 调 用 plot 方法 绘制 了 
三 条 BIAS 指标 线 。 

至 于 其 他 设置 图 例 、 网 格 线 和 坐标 轴 刻 度 文 字 等 代码 ， 在 之 前 类 似 的 范例 程序 中 多 次 讲解 过 ， 
所 以 这 里 不 再 重复 说 明了 。 

运行 这 个 范例 程序 ， 即 可 看 到 如 图 11-12 所 示 的 结果 。 


K 线 图 和 均线 图 


一 一 BIAS6 
— BIAS12 
一 BIAS24 
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图 11-12 KK 线 、 均 线 整合 BIAS 指标 图 的 效果 图 


11.3.3 ”基于 BIAS 指标 的 买卖 策略 


从 乖 离 率 的 算法 中 可 知 ， 如 果 当 前 股价 在 移动 均线 之 上 ， 乖 离 率 数值 为 正 数 ， 即 所 谓 的 正 乖 
离 率 ， 反 之 为 负 乖 离 率 。 当 然 ， 数 值 上 也 有 零 球 离 率 。 

从 乖 离 率 的 设计 原则 中 可 知 ， 正 乖 离 率 数值 越 大 ， 说 明 股 价 偏离 均线 的 程度 就 越 大 ， 即 股价 
涨幅 过 大 ， 因 此 再 度 上 涨 的 压力 就 变 大 ， 因 而 受 获 利 回 吐 因素 打压 而 下 跌 的 可 能 性 也 就 越 高 。 反 之 
亦 然 ， 负 的 乖 离 率 数值 越 大 ， 股 价 反弹 的 可 能 性 就 越 大 。 据 此 ， 给 出 如 下 的 基于 BIAS 指标 的 买卖 
策略 。 


(1) 从 数值 上 来 看 ， 当 某 个 股票 12 日 的 乖 离 率 大 于 7， 如 果 没有 其 他 重大 利好 因素 ， 则 是 短 
线 卖 出 时 机 ， 而 当 12 日 乖 离 率 小 于 -7 时 ， 如 果 没 有 其 他 利空 因素 ， 则 是 短线 买 入 时 机 。 

(2) 综合 短 中 长 期 (6 日 、12 日 和 24 日 ) 的 乖 离 率 数值 ， 当 短期 BIAS 数值 开始 在 低位 向 上 突 
破 ( 即 出 现金 又 ) 长 期 BIAS 曲线 时 ， 说 明 股价 的 弱势 整理 格局 可 能 被 打破 ， 股 价 短期 内 可 能 将 向 上 运 
动 。 如 果 此 时 中 期 BIAS 线 也 向 上 突破 长 期 BIAS 线 ， 说 明 股价 的 中 长 期 上 涨 行情 已 经 开始 。 

(3) 当 短 期 BIAS 线 在 高 位 向 下 掉头 时 ， 说 明 股 价 短期 上 涨 过 快 ， 可 能 出 现 向 下 调整 的 现象 ， 
如 果 此 时 中 期 BIAS 线 也 开始 在 高 位 向 下 掉头 时 ， 说 明 股 价 的 短期 上 涨 行情 可 能 结束 。 


在 实际 使 用 过 程 中 ， 对 BIAS 指标 还 有 如 下 要 注意 的 地 方 ， 这 些 也 都 是 在 实践 中 总 结 出 来 的 。 
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(1) 该 指标 在 确认 卖 出 信号 时 ， 会 存在 一 定时 间 范 围 上 的 滞后 性 。 而 且 当 股 市 处 于 大 熊市 下 
跌 初期 时 ， 用 该 指标 计算 买点 也 会 出 现 失误 ,最 好 是 在 下 跌 阶段 的 中 后 期 ( 即 熊 市 跌 过 一 阵 了 ) 开 
始 使 用 。 

(2) 对 那些 上 市 时 间 不 到 半年 的 新 股 ， 由 于 初始 化 样本 数 不 足 ， 判 断 的 失误 率 会 偏 高 。 

(3) 该 指标 的 适用 范围 是 弱 市 ， 对 弱 市 阶段 的 抢 反 弹 和 抄底 的 指导 意义 比较 明显 。 


11.3.4 在 Django 框架 中 绘制 BIAS 指标 图 


在 本 节 中 ， 首 先 将 通过 命令 新 建 一 个 空白 的 Django 项 目 ， 随 后 在 项 目 中 添加 一 个 用 于 指定 股 
票 代码 和 时 间 范 围 的 Form 表单 ， 并 且 绘 制 由 此 表单 所 指定 股票 和 时 间 范 围 的 K 线 、 均 线 和 BIAS 
指标 图 ， 有 具体 步骤 如 下 。 

本 FI01 运行 django-admin startprojectMyStockWeb 命令 ， 创 建 一 个 空白 的 Django 项 目 , 为 了 
方便 编写 代码 ， 在 Eclipse 开发 环境 中 新 建 一 个 同名 的 PyDev 项 目 ， 并 把 创建 好 的 空白 项 目 文 件 复 
制 其 中 。 该 步骤 具体 的 过 程 请 参考 11.2.2 小 节 的 说 明 。 

B02 在 MyStockWeb 目录 中 新 建 templates 目录 ， 在 其 中 存放 html 文件 ， 并 在 settings.py 
中 的 templates 项 里 增加 此 目录 ， 代 码 如 下 所 示 ， 这 样 就 能 到 该 目录 中 查找 对 应 的 html 文件 。 


和 TEMPLATES = [ 

2 

3 'DIRS': ['MyStockWeb/templates'], 
4 省 略 其 他 代码 

}, 

(| 


703 在 urlspy 文件 中 定义 请 求 跳 转 的 映射 规则 ， 代 码 如 下 所 示 。 


from django.contrib import admin 

from django.urls import path 

from django.conf.urls import url 

from . import mainForm 

urlpatterns = [ 
path('admin/', admin.site.urls), 
url('^mainForm/$', mainForm.display), 
url('^mainAction/$', mainForm.draw) 


] 


在 第 7 行 的 程序 语句 定义 了 mainForm 格式 的 请 求 交 由 mainForm 的 display 方法 去 处 理 , 在 第 
8 行 定 义 了 mainAction 格式 的 请 求 交 由 mainForm 的 draw 方法 去 处 理 。 


本 04 定义 mainForm 的 display 方法 ， 代 码 如 下 。 


Co oOp 


def display (request): 
2 return render(request, ‘main.html') 


结合 第 三 步 的 代码 ， 可 以 看 到 ， 一 旦 遇 到 mainForm 的 请 求 ， 则 会 跳 转 到 main html 页 面 。 
C05 编写 main html 页 面 ， 在 其 中 包含 了 接收 股票 信息 的 Form 表单 ， 代 码 如 下 。 
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<html> 
<meta charset="utf-8"> 
<head> 
<title> 分 析 股 票 </title> 
</head> 
<body> 
<form name="mainForm" action="/mainAction/" method="POST"> 
{% csrf token %} 
<table> 
<tr> 
<td> 股 票 代码 :</td> 
<td><input type="text" name="stockCode" id="stockCode" 
value="600007"/></td> 
</tr> 
<tr> 
<td> 开 始 时 间 </td> 
<td><input type="text" name="startDate" id="startDate" 
value="2019-01-01" /></td> 
</tr> 
<tr> 
<td> 结 束 时 间 </td> 
<td><input type="text" name="endDate" id="endDate" 
value="2019-05-31" /></td> 
</tr> 
<tr> 
<td colospan="2" align="center"> 
<input type="submit" name="submit" value=" 提 交 " />gnbsp;&nbsp; 
<input type="reset" name="reset" value=" 重 置 " /> 
</td> 
</tr> 
</table> 
</form> 
</body> 
</html> 


如 果 需 要 在 本 页 面 中 引入 中 文 ， 就 需要 加 入 第 2 行 的 代码 ， 指 定 本 页 面 的 编码 规范 是 utf-8。 
在 第 7 行 的 Form 表单 中 指定 了 跳 转 请 求 ， 在 Form 表单 内 部 分 别 在 第 12 行 、 第 16 行 和 第 20 


行 定 义 了 三 个 文本 框 ， 用 户 可 以 在 其 中 输入 股票 代码 〈stockCode) 、 开 始 时 间 〈startDate) 和 结束 
时 间 〈endDate) 等 信息 。 请 注意 ， 在 Django 的 Form 表单 中 ， 需 要 加 入 第 8 行 所 示 的 代码 ， 和 否则 
会 出 现 问题 。 


当 用 户 输入 完 信息 并 单 击 在 第 24 行 定义 的 “ 单 击 ” 按 钮 后 , 会 如 第 7 行 定义 的 那样 , 发 起 POST 


格式 的 mainAction 请 求 ， 通 过 第 三 步 定 义 的 映射 规则 ， 该 请 求 会 由 mainForm 文件 的 draw 方法 去 


处 至 


线 、 
1 


这 也 是 关键 的 一 步 , 编写 mainForm 中 的 draw 方法 ,在 其 中 计算 BIAS 值 , 并 绘制 K 
均线 和 BIAS 指标 图 ， 代 码 如 下 。 


# !/usr/bin/env python 
# coding=utf-8 
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2 


3 from django.shortcuts import render 

4 import pandas datareader 

5 import matplotlib.pyplot as plt 

6 import pandas as pd 

ys from mpl finance import candlestick2 ochl 

8 import sys 

9 from io import BytesIO 

10 import base64 

11 import imp 

12 imp.reload(sys) 

13 ”# 省 略 display 方法 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
14 间 计算 BIAS 的 函数 

15 def calBIRS (df,PeriodList) : 

16 # 省 略 中 间 计算 代码 ， 请 参考 本 书 提供 下 载 的 完整 范例 程序 
17 return df 


从 第 4 行 到 第 11 行 的 程序 语句 导入 了 本 范例 程序 所 需要 的 库 ， 请 注意 ， 需 要 加 入 第 12 行 的 


imp.reload(sys) 代 码 ， 否 则 在 某 些 Django 版 本 中 可 能 会 因 字 符 集 的 问题 而 导致 出 错 。 


在 第 15 行 定义 了 计算 BIAS 值 的 calBIAS 方法 ， 它 的 参数 以 及 计算 过 程 和 11.3.2 小 节 


DrawKwithBIAS.py 范例 程序 内 的 同名 方法 完全 一 致 ， 故 略 去 不 再 重复 说 明了 。 


18 def draw (request) : 


9 stockCode = request.POST.get ('stockCode') 

20 startDate = request.POST.get ('startDate') 

2 endDate = request.POST.get ('endDate') 

22 stock = pandas datareader.get data yahoo(stockCode+'.ss',startDate, 
endDate) 

23 # 删除 最 后 一 天 多 余 的 股票 交易 数据 

24 stock.drop (stock.index[len(stock)-1],inplace=True) 

2 filename='D:\\stockData\chll\\'+stockCodet+startDatetendDate+' .csv' 

26 stock.to_csv (filename) 

2 # 从 文件 中 读 取 指定 股票 在 指定 范围 内 的 交易 数据 

28 df = pd.read csv(filename,encoding='gbk') 

29 list = [6,12,24] # 周期 列表 

30 stockDataFrame = calBIAS (df,1ist) 

江 figure = plt.figure() 

32 (axPrice, axBIAS) = figure.subplots(2, sharex=True) 

33 # 绘制 K 线 

34 candlestick2 ochl (ax = axPrice, 

35: opens=df["Open"] .values, closes=df["Close"] .values, 

36 highs=df["High"] .values, lows=df["Low"] .values, 

32 width=0.75, colorup='red', colordown="'green') 

38 axPrice.set title("K 线 图 和 均线 图 ") 

39 stockDataFrame['Close'] .rolling (window=6) .mean(). plot (ax=axPrice, 


color="red", label='6 日 均线 ') 


40 stockDataFrame['Close'] .rolling (window=12) .mean(). plot (ax=axPrice, 


color="blue", label='12 日 均线 ') 


41 stockDataFrame['Close'] .rolling (window=24) .mean(). plot (ax=axPrice, 


color="green", label='24 日 均线 ') 
42 axPrice.legend (loc='best') # 绘制 图 例 
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43 axPrice.set ylabel ("价格 (单位 : 元 ) ") 

44 axPrice.grid(linestyle='-.') 

45 # 绘制 BIAS 指标 线 

46 stockDataFrame['BIAS6'] .plot (ax=axBIAS, color="blue",label='BIAS6') 
47 stockDataFrame['BIAS12'] .plot (ax=axBIAS, color="green",label='BIAS12') 
48 stockDataFrame['BIAS24'] .plot (ax=axBIAS, color="purple",label='BIAS24') 
49 Pplt.legend(loc='best') 

50 Plt.rcParams['font.sans-serif']=["'SimHei'] 

51 axBIAS.set title ("BIAS 指标 图 ") 

52 axBIAS.grid(linestyle='-.') 

33 major index=stockDataFrame.index[stockDataFrame. index%5==0] 

54 major xtics=stockDataFrame['Date'] [stockDataFrame. index%5==0] 

55 Pplt.xticks (major index,major xtics) 

56 plt.setp(plt.gca() .get xticklabels(), rotation=30) 

57 # 把 存储 在 plt 对 象 中 的 图 形 存 入 到 buffer 缓存 对 象 中 

58 buffer = BytesIO() 

59 Plt.savefig (buffer) 

60 Plt.close() 

61 base64img = base64.b64encode (buffer.getvalue()) 

62 img = "data:image/png;base64,"+base64img.decode() 

63 # 携带 img 参数 ， 跳 转 到 stock.html 页 面 

64 return render(request, 'stock.html', { 

65 ‘img': img,'stockCode':stockCode 

66 0 


在 第 18 行 定义 的 draw 方法 中 要 做 如 下 三 件 事情 : 

(1) 从 第 19 行 到 第 21 行 获取 从 main.html 页 面 经 POST 形式 发 来 的 参数 ， 并 在 第 22 行 通过 
调用 get_data_yahoo 方法 ， 从 网 站 获取 指定 股票 代码 在 指定 时 间 范 围 内 的 股票 交易 数据 。 由 于 通过 
该 网 站 获取 到 的 股票 交易 数据 会 多 一 天 , 因此 需要 通过 第 24 行 的 代码 删除 最 后 一 行 ( 即 最 后 一 天 ) 
的 股票 数据 ， 再 把 数据 保存 到 文件 中 。 

(2) 在 第 28 行 从 指定 文件 中 读 取 股 票数 据 ， 再 通过 第 30 行 的 代码 计算 该 股票 对 应 的 短 中 长 
期 的 BIAS 值 ， 随 后 通过 第 31 行 到 第 56 行 的 程序 代码 绘制 K 线 、 均 线 和 BIAS 指标 图 。 这 部 分 程 
序 代码 在 之 前 的 DrawKwithBIAS.py 范例 程序 中 已 经 分 析 和 说 明 过 ， 所 以 不 再 袭 述 。 不 过 ， 这 个 范 
例 程序 是 把 图 片 以 数据 流 的 形式 发 送 到 stock.html 页 面 ， 所 以 无 需 调用 pltshow() 方 法 将 图 片 显示 
出 来 。 

(3) 通过 第 59 行 到 第 62 行 的 程序 代码 把 包含 图 片 的 数据 流 以 base64 格式 进行 编码 ， 并 在 第 
64 行 跳 转 到 stock.html 页 面 时 , 作为 img 参数 传 过 去 , 而 且 在 第 64 行 通过 render 语句 进行 跳 转 时 ， 
还 携带 了 包含 股票 代码 信息 的 stockCode 变量 ， 这 样 当 draw 方法 执行 完成 后 ， 就 能 在 stock.html 
页 面 看 到 股票 代码 和 对 应 的 指标 图 。 


CT07 编写 绘制 股票 指标 图 的 stock.html 页 面 ， 代 码 如 下 。 


<html> 

<meta charset="utf-8"> 
<head> 
<title> 分 析 股票 </title> 
</head> 


MnODPp 
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6 <body> 
册 股票 代码 : {{ stockCode }}<br> 
8 <img src="{{ img }}"> 

9 </body> 

10 </html> 


这 段 代码 的 关键 是 : 在 第 7 行 输出 从 draw 方法 传 来 的 stockCode 变量 ， 在 第 8 行 以 输出 img 
变量 的 形式 显示 指标 图 。 

编写 完 上 述 代码 后 ， 启 动 manage.py 程序 ， 同 时 传 入 参数 “runserver localhost:8080”。 之 后 在 
浏览 器 中 输入 请 求 : http://localhost:8080/mainForm/, 此 时 按照 urls.py 中 的 定义 , 会 跳 转 到 main.html 
页 面 ， 随 后 就 能 看 到 如 图 11-13 所 示 的 Form 表单 。 


\ localhost 
谷歌 站 网 址 大 全 门 3650 搜 索 门 游 戏 中 心 名 员 jcrosoft 各 链接 


‘600007 
2019-01-01 
2019-05-31 


图 11-13 main.html 页 面 


在 图 11-13 中 ,可 以 输入 股票 代码 以 及 开始 和 结束 时 间 , 在 输入 的 时 候 请 注意 格式 ， 如果 输 错 
数据 ， 可 以 通过 单 击 “ 重 置 ” 按 钮 来 重 置 输 错 的 信息 。 

输入 完成 后 单 击 “ 提 交 ” 按 钮 ， 这 时 会 调用 mainForm.py 中 的 draw 方法 计算 BIAS 值 并 绘制 
对 应 的 指标 图 。draw 方法 运行 完成 后 ， 除 了 能 在 对 应 的 目录 中 看 到 csv 格式 的 包含 股票 信息 的 文 
件 之 外 ， 由 于 已 经 跳 转 到 stock.html 页 面 ， 因 此 还 能 在 页 面 看 到 如 图 11-14 所 示 的 结果 ， 在 其 中 包 
含 了 股票 代码 和 指标 图 。 


股票 代码 :600007 


kK 线 图 和 均线 图 


BIAS 指 标 图 | 


— BIAS6 
一 BIAS12 
— BIAS24 
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11-14 在 Diango 页 面 中 绘制 的 K 线 、 均 线 和 BIAS 指标 图 
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11.3.5 在 Django 框架 中 验证 买点 策略 


根据 11.3.3 小 节 给 出 的 关于 BIAS 指标 的 分 析 ， 本 节 要 验证 的 “买点 ”策略 是 ， 中 期 (12 日 ) 
BIAS 值 小 于 或 等 于 -7， 或 者 短期 (6 日 ) BIAS 值 上 穿 长 期 (24 日 ) 值 ， 即 形成 金 叉 。 
对 此 ， 在 mainForm.py 中 增加 一 个 实现 计算 买点 的 方法 calBuyPoints， 该 方法 的 代码 如 下 ， 参 
数 是 包含 股票 日 期 以 及 短 中 长 期 BIAS 指标 的 df 对象。 
def calBuyPoints (df): 
cnt=0 
buyDate="" 
while cnt<=len (df)-1: 
if (cnt>=30) : # 前 几 天 有 误差 ， 从 第 30 天 算 起 
# 规则 1: 这 天 中 期 BIAS 小 于 或 等 于 -7 
if df.iloc[cnt] ['BIAS12']<=-7: 
buyDate = buyDate+df.iloc[cnt]['Date'] + ',"' 
# 规则 2: 当天 BIRS6 上 穿 BIAS24 
0 if df.iloc[cnt]['BIRS6']>df.iloc[cnt]['BIRS24'] and 
df.iloc[cnt-1] ['BIAS6']<df.iloc[cnt-1] ['BIAS24']: 
了 于 buyDate = buyDate+df.iloc[cnt]['Date'] + ',"' 
12 cnt=cnt+1 
3 return buyDate 


在 第 4 行 的 while 循环 中 ， 依 次 遍历 了 df 对象， 由 于 之 前 可 能 出 现 BIAS 指标 值 为 0 的 情况 ， 
因此 过 滤 掉 前 30 个 交易 日 的 数据 。 

在 第 7 行 的 让 语句 中 ,指定 如 果 当 天 的 中 期 BIAS 值 小 于 或 等 于 -7， 则 在 buyDate 对 象 中 记录 
下 当天 的 日 期 。 在 第 10 行 的 让 语句 中 , 如 果 出 现 前 一 天 BIAS6 值 小 于 BIAS24 且 当 天 BIAS6 大 于 
BIAS24〈 即 当天 出 现 上 穿 的 金 叉 现象 ) ， 那 么 也 把 当天 的 日 期 记录 到 buyDate 对 象 中 。 由 于 这 两 
个 条 件 是 “或 ”的 关系 ， 因 此 第 7 行 和 第 10 行 的 让 语句 是 并 列 的 关系 ， 该 方法 最 后 在 第 13 行 返 
回 包含 买点 日 期 的 buyDate 对 象 。 

本 节 先 不 给 出 该 计算 买点 方法 的 调用 方式 和 运行 结果 ， 等 到 后 文 讲述 完 计算 卖点 的 方法 之 后 
再 一 并 给 出 。 


PomomwanumewnP 


11.3.6 在 Django 框架 中 验证 卖点 策略 


本 节 要 验证 的 “卖点 ”策略 是 和 11.3.5 小 节 讲 述 的 “买点 ”策略 相对 应 ， 中 期 (12 日 ) BIAS 
值 大 于 或 等 于 7, 或 者 短期 (6 日 )BIAS 值 下 穿 长 期 (24 日 ) 值 , 即 形成 死 叉 。 对 此 , 在 mainForm.py 
中 ， 增 加 calSellPoints 方法 来 计算 卖点 日 期 ， 代 码 如 下 。 


1 def calSellPoints (df) : 
cnt=0 
sellDate="" 
while cnt<=len (df)-1: 
if(cnt>=30) : # 前 几 天 有 误差 ， 从 第 30 天 算 起 
# 规则 1: 这 天 中 期 BIAS 大 于 或 等 于 7 
if df.iloc[cnt] ['BIAS12']>=7: 


auwm 必 wb 
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8 sellDate = sellDate+df.iloc[cnt]['Date'] + ',"' 

9 # 规则 2: 当天 BIAS6 下 穿 BIAS24 

10 if df.iloc[cnt]['BIAS6']<df.iloc[cnt]['BIAS24'] and 
df.iloc[cnt-1] ['BIAS6']>df.iloc[cnt-1] ['BIAS24']: 

11 sellDate = sellDate+df.iloc[cnt]['Date'] + ',"' 

12 cnt=cnt+1 

13 return sellDate 


这 段 代 码 与 之 前 的 calBuyPoints 方法 很 相似 ， 依 然 是 通过 第 4 行 的 while 循环 语句 遍历 包含 
BIAS 值 的 df 对 象 。 

差别 之 处 是 计算 买点 和 卖点 的 两 个 规则 , 在 第 7 行 的 让 语句 中 ， 当 中 期 BIAS 值 大 于 或 等 于 7 
时 ， 则 把 当前 日 期 记录 到 sellDate 变量 中 ， 在 第 10 行 并 列 的 让 语句 中 ， 如 果 判 定 出 现 BIAS6 下 穿 
BIAS24 的 现象 ， 那 么 也 把 当前 日 期 记录 到 sellDate 变量 中 ， 最 终 是 通过 第 13 行 的 return 语句 返回 

编写 完 calBuyPoints 和 calSellPoints 方法 后 ， 在 mainForm.py 文件 的 draw 方法 中 ， 加 入 如 下 
两 条 调用 语句 ， 分 别 用 buyDate 和 sellDate 两 个 变量 来 接收 调用 结果 。 


1 buyDate = calBuyPoints (stockDataFrame) 
加 sellDate = calSellPoints (stockDataFrame) 


在 最 后 跳 转 到 stock.html 页 面 的 return 语句 中 ， 需 要 编写 下 面 第 3 行 的 代码 ， 向 stock.html 页 
面 传递 上 述 的 两 个 参数 buyDate 和 sellDate， 代 码 如 下 。 


主 return render(request, 'stock.html', { 

加 'img': img,'stockCode':stockCode, 

3 "buyDate' :buyDate, 'sellDate':sellDate 
| Fy 


在 stock.html 页 面 中 , 需要 编写 下 面 第 8 行 和 第 9 行 所 示 的 程序 代码 , 以 显示 买点 和 卖点 日 期 。 


1 <html> 

2 <meta charset="utf-8"> 

3 <head> 

4 ”<title> 分 析 股 票 </title> 

5 </head> 

6 <body> 

7 股票 代码 : {{ stockCode }}<br> 
8 买点 日 期 :{{ buyDate }}<br> 
9 卖点 日 期 :{{ sellDate }}<br> 
10 <img src="{{ img }}"> 

11 </body> 

12 </html> 


完成 上 面 的 代码 修改 后 , 启动 manage.py 程序 ,在 浏览 器 中 输入 http://localhost:8080/mainForm/， 
这 次 用 600460 〈 士 兰 微 ) 股票 来 验证 ， 如 图 11-15 所 示 。 

在 如 图 11-15 所 示 的 界面 中 完成 输入 后 ， 单 击 “ 提 交 ” 按 钮 ， 随 后 在 stock.html 页 面 中 ， 除 了 
BIAS 等 指标 图 外 ， 还 能 看 到 具体 的 买点 和 卖点 日 期 ， 如 图 11-16 所 示 。 
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票 代码 : [6o0460 


开始 时 间 2019-01-01 
结束 时 间 2019-05-31 


图 11-15 用 股票 代码 600460 来 验证 BIAS 指标 的 买卖 点 


股票 代码 :ED 
买点 日 期 :2019-04-15, 2019-05-06, 2019-05-06, 2019-05-07, 2019-05-08, 2019-05-09， 
卖点 日 期 :2019-03-06, 2019-03-07, 2019-03-08, 2019-03-11, 2019-03-12, 2019-03-13, 2019-03-14 


17, 2019-05-20, 2019-05-20, 2019-05-21, 2019-05-22, 


K 线 图 和 均线 图 


BIAS 指 标 图 
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图 11-16 基于 BIAS 指标 的 买卖 点 示意 图 


从 中 图 11-16 可 以 看 到 ， 买 点 日 期 尚 属 正确 ， 在 这 些 买 点 日 期 之 后 ， 股 价 多 少 有 些 上 涨 ， 至 少 
有 出 货 的 机 会 。 而 卖点 日 期 就 有 些 多 ， 指 导 性 就 不 强 了 ， 图 11-16 只 显示 了 其 中 一 部 分 ， 全 部 的 卖 
点 日 期 如 下 所 示 。 卖 点 日 期 指导 性 不 强 的 原因 是 ，BIAS 指标 更 适用 于 弱势 ， 而 在 下 述 日 期 的 前 后 
几 天 范围 内 股价 波动 比较 厉害 ， 因 此 该 指标 有 钝 化 的 现象 。 
卖点 日 期 :2019-03-06,2019-03-07,2019-03-08,2019-03-11,2019-03-12， 
2019-03-13,2019-03-14, 2019-03-15, 2019-03-18,2019-04-01, 
2019-04-02,2019-04-16, 2019-05-17, 2019-05-20,2019-05-20, 
2019-05-21,2019-05-22, 


11.4 本 章 小 结 


本 章 讲述 的 主要 内 容 是 基于 Python 语言 的 Web 编程 ， 尤 其 着 重 讲述 了 Django 框架 ， 用 到 的 
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股票 指标 是 乖 离 率 (BIAS) 。 在 本 章 的 开始 部 分 ， 通 过 演示 基于 WSGI 规范 的 编程 方式 ， 讲 述 了 
引入 Diango 框架 的 必要 性 ， 随 后 通过 范例 程序 演示 了 基于 Django 框架 的 Web 项 目 开发 方式 ， 由 
于 Django 框架 有 效 地 分 离 了 MVC 等 模块 ， 因 此 基于 Django 的 Web 框架 比较 容易 扩展 和 维护 。 
在 讲 完 乖 离 率 的 实现 算法 之 后 ,用 范例 程序 进一步 演示 了 Django 框架 的 用 法 ,而且 还 在 Django 
框架 中 实现 了 验证 乖 离 率 买 点 和 卖点 的 功能 。 
虽然 本 章 给 出 的 Django 范例 程序 并 不 复杂 ， 但 如 果 要 实现 复杂 的 功能 ， 读 者 可 以 参照 本 章 给 
出 的 思路 ， 在 Django 框架 中 通过 扩展 映射 项 和 功能 文件 的 方式 来 逐步 完善 复杂 的 业务 功能 。 


以 OBV 范例 深入 讲述 Django 框架 


在 一 般 的 Web 应 用 中 ， 往 往 都 会 有 对 数据 库 的 操作 ， 比 如 页 面 从 数据 库 中 读 取 数 据 以 实现 动 
态 的 效果 ， 或 者 把 信息 存 入 数据 库 中 ， 以 达到 “数据 持久 化 ”的 目的 ， 本 章 将 讲述 Django 框架 整 
合 MySQL 数据 库 的 方式 。 另 外 ， 一 般 的 Web 应 用 也 会 引入 日 志 来 定位 并 排查 问题 ， 本 章 将 讲述 
在 Django 框架 中 引入 不 同 级 别 日 志 的 方法 。 

本 章 使 用 的 股票 指标 是 平衡 交易 量 (OBV) 指标 ， 通 过 本 章 的 范例 程序 ， 读 者 能 接触 到 基于 
Python 网 站 开发 的 常用 技术 ， 如 MVC、 日 志和 数据 库 等 。 不 少 Web 应 用 虽然 页 面 多 ， 但 核心 技术 
也 就 上 述 这 些 ， 所 以 通过 本 章 的 学 习 ， 读 者 应 该 能 毫 无 困难 地 开发 基于 Django 的 Web 应 用 。 


12.1 在 Django 框架 内 引入 日 志 


在 一 般 的 Python 程序 中 ， 可 以 通过 print 语句 向 控制 台 输 出 日 志 ， 不 过 在 基于 Django 框架 的 
Web 项 目 中 ， 不 可 能 仅仅 把 日 志 输出 到 控制 台 ， 原 因 有 两 个 : 

(1) 在 启动 服务 后 不 可 能 一 直 果 着 控制 台 看 日 志 ; 

(2) 应 该 把 日 志 存 入 到 文件 中 ， 这 样 出 了 问题 也 能 方便 地 从 日 志文 件 中 查看 当时 的 记录 ， 以 
便 定 位 和 分 析 问 题 。 

在 本 节 中 ， 首 先 将 讲述 不 同 级 别 日 志 的 使 用 场合 ， 其 次 将 讲述 在 Django 框架 内 向 控制 台 和 文 
件 中 输出 不 同 级 别 的 日 志 。 


12.1.1 不 同 级 别 日 志 的 使 用 场合 


在 Django 框架 中 ， 可 以 用 logging 模块 来 处 理 日 志 ， 该 模块 提供 了 如 表 12-1 所 示 的 不 同 级 别 
的 日 志 。 
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表 12-1 logging 模块 不 同 级 别 日 志 一 览 表 


[日 志 级 别 [ER 
| CRITICAL | 输出 因 发 生 严 重 错 误导 致 程序 不 能 继续 运行 时 的 信息 

| ERROR | 用 于 输出 错误 信息 ， 比 如 数据 库 连 接 出 错 

程序 能 正常 运行 , 但 出 现 和 预期 不 符 的 信息 , 则 此 类 信息 用 WARNING 级 别 输出 
比如 虽然 程序 能 运行 但 远 端 调 用 返回 时 间 过 长 


| WARNING | 


INFO 输出 关键 点 的 消息 ， 比 如 关键 函数 的 输入 参数 和 返回 值 


DEBUG 一 般 在 调试 阶段 用 DEBUG 级 别 的 日 志 ， 可 以 打印 输出 与 功能 测试 相关 的 信息 


在 一 般 的 项 目 实践 中 , CRITICAL 级 别 的 日 志 不 经 常 出 现 , 毕竟 严 重 的 问题 一 般 在 测试 阶段 就 
已 经 暴露 出 来 了 , 而 且 CRITICAL 和 ERROR 级 日 志 的 区 别 并 不 容易 掌握 ， 所 以 错误 类 日 志 往 往 用 
ERROR 级 别 来 输出 。 

另外 ， 为 了 方便 排查 和 定位 问题 ， 日 志 应 当 有 指向 性 ， 从 这 个 意义 上 来 讲 ， 不 该 把 所 有 方法 
的 输入 参数 和 返回 值 都 用 INFO 级 别 的 日 志 输出 ,如 果 这 样 的 话 , 会 因为 日 志 信 息 量 太 大 而 导致 很 
难 排查 问题 ， 应 当 仅 用 INFO 日 志 输 出 关键 性 函数 的 输入 参数 和 返回 值 。 

出 于 相同 的 原因 ， 一 般 是 通过 DEBUG 级 别 的 日 志 排查 调试 阶段 的 问题 ， 所 以 在 程序 上 线 后 ， 
往往 不 输出 DEBUG 级 别 的 日 志 。 


12.1.2 ”向 控制 台 和 文件 输出 不 同 级 别 的 日 志 


本 节 将 在 新 建 的 Django 项 目 中 定义 不 同 的 日 志 输 出 模式 ， 从 而 实现 如 下 的 日 志 输出 规范 。 


(1) 因为 往往 会 把 生产 环境 中 的 日 志 放 在 文件 内 , 而 DEBUG 级 别 的 日 志 大 多 包含 调试 信息 ， 
所 以 此 级 别 的 日 志 只 输出 到 控制 台 ， 不 输出 到 文件 中 。 

(2) ERROR 级 别 的 日 志 比较 重要 ， 因 为 反映 出 了 生产 环境 中 的 错误 信息 ， 所 以 该 级 别 的 日 
志 要 输出 到 专门 的 errorlog 文件 中 ， 该 文件 除了 ERROR 级 别 的 日 志 外 ， 不 包含 其 他 级 别 的 日 志 。 


定义 日 志 规 范 的 具体 步骤 如 下 : 


CT01 在 MyEclipse 中 创建 名 为 MyDjangoLogProj 的 Django 项 目 ， 在 其 中 的 src 目录 中 创 
建 log 目录 ， 并 在 log 目录 中 新 建 myLog.log 和 errorlog 这 两 个 日 志文 件 ， 如 图 12-1 所 示 。 其 中 log 
目录 和 MyDjangoLogProj 目录 平行 。 


日 B NyDjaneoLogProj 
日 通 se 
BE log 
国 srror.log 
国 wylog. log 
量 出 


init_.py 


由 - 回 settings. py 
由 - 回 urls.py 
由 - 回 view.py 
由 -加 wsgi.py 


图 12-1 新 建 的 日 志 目 录 和 日 志文 件 
02 在 settings.py 文件 中 ， 添 加 如 下 的 关于 日 志 的 配置 信息 ， 代 码 如 下 。 
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1 LOGGING = { 

名 vorsion"s 1y 

六 'disable existing loggers': False, 

4 # 定义 格式 

5 'formatters': { 

6 # 复杂 的 打印 格式 

际 "myFormat': { 

8 ‘format': '[%(asctime)s] [% (threadName)s:%(thread)d] 
[task id:%$(name)s] [%(levelname)s] %(message)s' 


汪 ] 

10 # 简单 的 打印 格式 

11 'mySimpleFormat': { 

2 'format': '[%(asctime)s] [%(levelname)s] %(message)s' 
13 }, 

14 ]}， 


在 第 5 行 开始 的 formatters 元 素 中 定义 了 两 类 日 志 的 输出 格式 ， 首 先 在 第 8 行 定义 了 名 为 
myFormat 的 较为 复杂 的 日 志 输出 格式 ， 其 中 包含 了 线程 号 和 任务 名 〈id) ， 而 在 第 12 行 定义 的 名 
为 mySimpleFormat 的 格式 中 ， 仅 仅 包含 了 输出 时 间 ， 日 志 级 别 和 日 志 内 容 。 

15 # 定义 过 滤器 


16 

i # 启用 debug 

18 "enableDebug': { 

19 '()': "django.utils.1log.RequireDebugTrue' 
20 }, 

2 "disableDebug': { 

22 '()':; 'django.utils.1og.RequireDebugFalse'， 
23 EL 

24 Ys 


在 第 16 行 开始 定义 的 过 滤器 filters 元 素 中 ， 分 别 在 第 18 行 和 第 21 行 定义 了 “启用 ”和 “ 禁 
用 ”debug 模式 的 两 个 属性 。 


2 "handlers': { 

26 'console':{ 

之 渴 'level':'DEBUG', 

28 # debug 级 别 日 志 输 出 到 控制 台 

29 'filters': ['enableDebug'], 

30 'class':'logging.StreamHandler', 
31 'formatter': ‘'mySimpleFormat' 

3 }, 

33 "default': { 

34 'level': 'INFO', 

25 "class': "logging.FileHandler', 
36 'filename': os.path.join(BASE DIR, 'log/myLog.10g'), 
37 'formatter': "myFormat" 

38 }, 

39 # 针对 DEBUG 级 别 的 日 志 

40 "debug': { 


41 "level': 'DEBUG', 
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42 "filters': ['enableDebug'], 

43 "class': '1ogging.FileHandler' 

44 'filename': os.path.join (BASE DIR, 'log/error.10g'), 
45 'formatter': 'myFormat" 

46 }， 

47 # 针对 ERROR 级 别 的 日 志 

48 Wor 

49 ‘level': 'ERROR', 

50 "filters': ['disableDebug'], 

Si 'class': 'logging.FileHandler', 

52 'filename': os.path.join (BASE DIR, 'log/error.10g'), 
53 ‘formatter': ‘'myFormat' 

54 

55 ]， 


在 第 25 行 开 始 定义 的 handlers 元 素 中 定义 了 若干 种 日 志 输 出 模式 。 在 第 26 行 定义 的 console 
模式 中 ,在 第 29 行 的 代码 指定 了 DEBUG 级 别 的 日 志 ( 以 及 之 上 级 别 的 INFO、WARNING 和 ERROR 
日 志 ) 采用 'enableDebug' 过 滤器 ， 即 启用 debug 模式 ， 第 30 行 指定 了 日 志 的 处 理 类 是 
"ogging.StreamHandler， 即 通过 流 的 方式 向 控制 台 输 出 日 志 , 第 31 行 指 定 了 采用 'mySimpleFormat' 
格式 来 输出 DEBUG 级 别 的 日 志 。 

在 第 33 行 定 义 的 default 模 式 中 ,第 35 行 指定 了 INFO 级 别 的 日 志 ( 以 及 之 上 级 别 的 WARNING 
和 ERROR 日 志 ， 不 包含 之 下 的 DEBUG 级 日 志 ) 用 '"logging.FileHandler' 类 来 处 理 ， 即 输出 到 文 
件 中 ,在 第 36 行 里 指定 了 输出 日 志 的 文件 为 log 目录 下 的 myLog.log 文件 ， 在 第 37 行 指 定 了 文件 
输出 的 格式 是 之 前 定义 的 'myFormat'。 

之 后 用 相似 的 方式 ,在 第 40 行 和 第 47 行 定义 了 DEBUG 级 别 和 ERROR 级 别 日 志 的 输出 方式 ， 
请 注意 ERROR 级 别 日 志 的 输出 模式 ,在 第 50 行 指定 了 ERROR 级 别 日 志 “ 禁 用 DEBUG”， 这 是 
因为 在 生产 环境 中 无 需 输出 DEBUG 级 别 的 日 志 ， 在 第 52 行 指定 了 ERROR 级 别 的 日 志 还 需 向 


error.log 文件 中 输出 。 
下 面 定义 了 若干 日 志 输出 模式 将 应 用 在 之 后 的 loggers 元 素 中 。 
56 11oggers': { 
57 | 
58 'handlers': ['console', 'default','error'], 
59 'level': 'DEBUG'" 
60 }, 
61 'errorOnly': { 
62 ‘'handlers': ['debug','error'], 
63 'level': 'ERROR' 
64 } 
65 x 
66 1} 


在 第 56 行 定义 的 loggers 元 素 中 ， 第 57 行 定义 了 默认 的 日 志 处 理 规则 ， 在 其 中 的 第 58 行 中 
用 到 了 之 前 定义 的 三 种 模式 ， 在 第 61 定义 了 errorOnly 处 理 规则 ， 在 其 中 的 第 62 行 中 引入 了 两 种 
模式 ， 在 第 63 行 指定 了 该 规则 仅 限于 ERROR 级 别 。 

综合 上 面 的 描述 可 以 看 到 ， 为 了 在 Django 内 输出 日 志 ， 需 要 在 settings.py 文件 中 配置 四 类 元 
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下 面 通过 表 12-2 来 总 结 一 下 这 四 类 元 素 的 作用 。 
表 12-2 日 志 相关 的 四 类 元 素 的 作用 一 览 表 


元 素 名 使 用 场合 
定义 元 素 的 输出 格式 ， 应 用 在 handlers 元 素 中 ， 其 中 诸如 myFormat 等 名 字 可 以 自 


fommatters 。 | 己 定 义 ， 但 需要 和 引用 的 地 方 相 一 致 

ee 定义 日 志 模 式 在 哪些 场景 里 生效 的 过 滤器 , 其 中 诸如 enableDebug 等 名 字 也 可 以 自 
己 定 义 

定义 日 志 的 输出 模式 ， 比 如 console 模式 定义 DEBUG 级 日 志 只 能 输出 到 控制 台 ， 


同样 ，console 等 名 字 也 可 以 自己 定义 


loggers 定义 日 志 的 规则 实例 ， 比 如 errorOnly 实例 定义 了 ERROR 级 日 志 的 输出 方式 
人 ER63 定义 URL 映射 规则 和 处 理 函数 。 


在 urls.py 文件 的 urlpatterns 中 ， 新 加 了 第 3 行 和 第 4 行 两 个 映射 规则 ， 其 中 具体 的 处 理 方法 
或 函数 ) 是 在 view.py 中 定义 的 。 
urlpatterns = [ 
path('admin/', admin.site.urls), 
path('log/', view.logDemo), 


path('errorLog/', view.errorOnlyDemo) 


] 
创建 view.py 文件 ， 在 其 中 添加 如 下 的 代码 。 


# !/usr/bin/env python 

# coding=utf-8 

from django.http import HttpResponse 

import sys 

import imp 

imp.reload(sys) 

import logging 

# 引用 django 日 志 实 例 

def logDemo (request): 
logger = logging.getLogger( name ) 
logger.debug ("debug level 1log") 
logger.warning ("warning level 1o0g") 
logger.info("info level log") 
logger.error ("error level lo0g") 
return HttpResponse ("Demo Log.") 

# 引用 erroronly 日 志 实 例 

def errorOnlyDemo (request) : 
logger = 1ogging.getLogger ('errorOnly'") 
logger.debug ("debug level 1log") 
logger.warning ("warning level 1og") 
logger .info("info level 1og") 
logger.error ("error level 1log") 
return HttpResponse("Only display error 1og.") 
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分 别 在 第 8 行 和 第 17 行 定义 了 处 理 两 个 不 同 url 请 求 的 方法 (或 函数 ) ， 除 了 最 后 输出 的 文 
字 不 同 之 外 ， 都 用 logger 实例 输出 了 DEBUG、WARNING、INFO 和 ERROR 四 种 级 别 的 日 志 。 

请 注意 第 10 行 和 第 18 行 的 getLogger 方法 。 在 logDemo 方法 内 的 getLogger 方法 中 的 参数 是 
_name ， 即 表示 当前 的 文件 名 ， 而 在 errorOnlyDemo 方法 内 的 getLogger 方法 中 的 参数 则 是 
errorOnly。 

编写 完 上 述 程序 代码 之 后 ， 以 带 “runserver localhost:8080” 参 数 的 方式 启动 manage.py 文件 ， 
监听 localhost 的 8080 端口 。 随 后 在 浏览 器 中 输入 http://localhost:8080/log/, 此 时 就 能 看 到 Demo Log 
的 文字 ， 不 过 这 不 是 重点 ， 要 关注 的 是 输出 的 日 志 。 在 控制 台中 与 日 志 相 关 的 输出 如 下 : 

[2019-07-15 07:10:35,437] [DEBUG] debug level log 

[2019-07-15 07:10:35,453] [WARNING] warning level log 

[2019-07-15 07:10:35,468] [INFO] info level log 

[2019-07-15 07:10:35,468] [ERROR] error level log 

在 myLog.log 文件 中 与 日 志 相关 的 输出 如 下 。 

[2019-07-15 07:10:35,453] [Thread-1:4572] [task_id:MyDjangoLogProj .view] 
[WARNING] warning level log 

[2019-07-15 07:10:35,468] [Thread-1:4572] [task id:MyDjangoLogProj .view] [INFO] 

info level log 

[2019-07-15 

07:10:35,468] [Thread-1:4572] [task id:MyDjangoLogProj.view] [ERROR] error 

level log 

在 处 理 log/ 请 求 的 logDemo 方法 中 , getLogger 的 输入 参数 在 loggers 元 素 中 找 不 到 对 应 的 实例 
名 ， 所 以 就 采用 默认 的 规则 ， 在 默认 规则 中 包含 了 ['console', 'default','error'] 三 种 输出 模式 ， 其 中 
在 console 模式 中 定义 了 DEBUG 级 别 以 及 之 上 级 别 的 日 志 都 输出 到 控制 台 上 。 

在 default 模式 中 定义 了 INFO 级 别 以 及 之 上 级 别 的 日 志 (不 含 DEBUG 级 别 ) 输出 到 文件 中 ， 
所 以 在 myLog.log 文件 中 看 不 到 DEBUG 级 别 的 日 志 , 而 在 控制 台 上 能 看 到 DEBUG 级 别 以 及 之 上 
级 别 的 四 种 日 志 。 

此 外 ， 由 于 在 默认 的 规则 中 没有 引入 ERROR 级 别 日 志 的 打印 模式 , 因此 ERROR 级 别 的 日 志 
也 是 输出 到 myLog.log 文件 中 ， 而 没有 输出 到 error.log 文件 中 。 要 注意 的 是 ， 控 制 台 的 日 志 输 出 采 
用 的 是 mySimpleFormat 格式 ， 所 以 不 含 线程 号 和 任务 名 (id) ， 输 出 到 文件 的 日 志 格 式 是 
"myFormat'， 因 而 还 额外 多 出 了 Thread 和 task_id 的 内 容 〈 即 线程 和 任务 id) 。 

如 果 在 浏览 器 中 输入 http://localhost:8080/errorLog/， 在 页 面 上 就 可 以 看 到 “Only display error 
log.” 的 输出 。 在 error.log 文件 中 ， 虽 然 在 view.py 文件 的 errorOnlyDemo 方法 中 也 有 输出 INFO 等 
其 他 级 别 的 日 志 ， 但 只 能 看 到 如 下 关于 ERROR 级 别 日 志 的 输出 。 

[2019-07-15 22:04:59,593] [Thread-5:1568] [task id:errorOnly] [ERROR] 
error level log 

这 是 因为 在 errorOnly 日 志 规 则 中 定义 了 向 error.log 文件 中 输出 ， 且 在 此 日 志 规则 中 ， 通 过 第 
63 行 的 "level': 'ERROR' 语句 指定 了 向 error.log 文件 只 输出 ERROR 级 别 及 之 上 级 别 的 日 志 。 
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12.2 在 Django 框架 内 引入 数据 库 


在 大 多 数 Web 应 用 中 , 页 面 上 的 数据 动态 地 来 自 数据 库 , 在 本 节 中 , 将 讲述 Django 与 MySQL 
数据 库 整合 的 用 法 ， 如 果 要 整合 其 他 数据 库 ， 方 法 其 实 是 大 同 小 异 的 。 


12.2.1 整合 并 连接 MySQL 数据 库 


可 以 在 Django 框架 内 修改 配置 文件 并 编写 Model 类 ， 随 后 就 可 以 通过 Python 命令 在 MySQL 
数据 库 中 创建 在 Django 内 定义 好 的 数据 表 ， 具 体 步 骤 如 下 。 

CT01 创建 名 为 MyDjangoDBProj 的 Django 项 目 ， 在 该 项 目 中 ， 使 用 了 第 8 章 讲 过 的 
PyMySQL 库 来 连接 MySQL 数据 库 ， 因 而 需要 在 _init_.py 中 添加 如 下 两 行 代码 ， 以 便 在 项 目 启动 
时 导入 PyMySQL。 同 时 ， 在 manage.py 程序 的 最 后 ， 也 加 入 如 下 两 行 代 码 。 


import pymysql 
pymysql.install as MySQLdb() 


CW02 在 settings.py 中 ， 修改 DATABASES 配置 项 的 代码 ， 如 下 所 示 。 


1 DATABASES = { 

浊 "default': { 

和 'ENGINE': 'django.db.backends.mysql'， # 数据 库 引擎 
4 'NAME': 'djangoStock' # 数据 库 名 
5 NUSER; roOtt, # 用 户 名 
6 "PRSSWORD': '123456', # 密码 

a "HOST'; ‘localhost', # 主机 名 
8 xPORR :S306u # 端口 号 
9 'OPTIONS':{'isolation level':None} 

10 } 

11 } 


其 中 在 第 3 行 指定 了 数据 库 引擎 ， 在 第 4 行 指定 了 要 连接 的 MySQL 数据 库 的 名 字 ， 在 第 5 
行 到 第 8 行 分 别 指定 了 连接 所 需 的 用 户 名 、 密 码 、 连 接地 址 和 端口 号 。 

请 注意 , 这 里 需要 像 第 9 行 那样 把 数据 库 的 隔离 级 别 设置 为 None，, 否则 在 之 后 用 Python 命令 
生成 数据 库 时 可 能 会 出 现 问题 。 

CJ03 通过 Navicat 或 其 他 MySQL 的 客户 端 连 接 到 localhost3006, 并 创建 名 为 djangoStock 
的 数据 库 ， 这 个 数据 库 名 必须 和 第 二 步 在 settings.py 文件 内 设置 的 DATABASES 配置 相 一 致 

人 4 在 settings.py 所 在 的 目录 中 ， 创 建 名 为 models.py 的 数据 库 模型 类 ， 在 该 文件 内 创建 
名 为 stockInfo 的 模型 ， 代 码 如 下 。 


1 # !/usr/bin/env Python 
2 # coding=utf-8 
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3 from django.db import models 

4 

3 class stockInfo (models.Model): 

6 date = models.CharField('date', max length=10) 
名 open = models.FloatField('open') 

8 close = models.FloatField('close’') 

9 high = models.FloatField('high') 

10 low = models.FloatField('low') 

:ht Vol = models.IntegerField('vol') 

2 stockCode = models.CharField('stockCode', max length=10) 
13 class Meta: 

14 db table = "stockInfo' 


在 第 5 行 定 义 的 stockInfo 类 是 Model 类 ， 它 对 应 MySQL 数据 库 的 stockInfo 数据 表 。 在 第 6 
行 到 第 12 行 的 代码 中 定义 了 stockInfo 类 的 诸多 对 象 与 stockInfo 数据 表 间 的 映射 关系 。 比 如 在 第 6 
行 定 义 了 stockInfo 类 的 date 属性 与 stockInfo 数据 表 内 的 char 类 型 〈 即 字符 串 类 型 ) 的 date 字段 
相对 应 ， 在 第 7 行 中 则 定义 了 open 属性 与 float 类 型 〈 即 浮 点 型 ) 的 open 字段 相对 应 ， 其 他 各 项 

在 第 13 行 和 第 14 行 的 代码 中 ,通过 了 class Meta 内 的 db table 定 义 了 第 5 行 所 定义 的 stockInfo 
这 个 Model 类 对 应 于 MySQL 数据 库 中 的 stockInfo 数据 表 。 

请 注意 ， 为 了 避免 混淆 ， 数 据 库 名 一 般 和 Model 类 名 一 致 ， 比 如 在 这 个 范例 程序 中 数据 库 名 
和 Model 类 名 都 叫 stockInfo， 而 Model 中 的 属性 名 (比如 date) 往往 和 对 应 数据 表 中 的 字段 名 保 
持 一 致 。 

O305 在 settings.py 内 的 INSTALLED_APPS 中 ,添加 本 项 目 名 ,代码 如 下 。 


1 INSTALLED APPS = [ 

2 ‘django.contrib.admin', 

| "django .contrib .auth'v 

4 "django .contrib .contenttypes'y 
小 "django .contrib.sessions' 

6 "django .contrib.messages'v 

| "django .contrib .staticfiles'yv 
8 "MYyDJjangoDBProj' 

:A | 


其 中 第 2 行 到 第 7 行 是 原来 就 有 的 代码 ， 第 8 行 是 新 添加 的 本 项 目 名 。 

人 6 通过 Python 命令 , 在 MySQL 的 djangoStock 数据 库 中 创建 与 stockInfo 类 相对 应 的 数 
据 表 。 启 动 “命令 提示 符 ” 窗 口 ， 切 换 到 MyDjangoDBProj 项 目的 manage.py 程序 文件 所 在 的 目录 ， 
执行 如 下 两 条 Python 命令 。 


Python manage.py makemigrations MyDjangoDBProj 
Python manage.py migrate MyDjangoDBProj 
执行 完 这 两 条 命令 后 ,就 能 在 MySQL 的 djangoStock 数据 库 中 看 到 创建 好 的 stockinfo 数据 表 ， 
其 中 的 字段 结构 如 图 12-2 所 示 。 由 于 在 stockInfo 这 个 Model 类 中 并 没有 设置 对 应 数据 表 的 主键 ， 
因此 Django 会 自动 添加 一 个 名 为 id 的 自 增长 主键 。 
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|_ 名 类 型 长 度 小 数 点 ”区 许 空 值 
Mi 11 0 口 PH! 

date varchar 10 0 口 

open double 0 0 口 

close double 0 0 口 

hiah double 0 0 加 | 

low double 0 0 口 

vol int 11 0 口 

stockCode varchar 10 0 口 


12-2 ”通过 Python 命令 创建 好 的 stockinfo 数据 表 


12.2.2 ”以 Model 的 方式 进行 增删 改 查 操作 


通过 12.2.1 小 节 所 述 的 步骤 创建 完 stockInfo 这 个 Model 类 和 对 应 的 数据 表 以 后 ， 就 可 以 通过 
这 个 Model 类 来 对 数据 表 进 行 增删 改 查 的 操作 , 在 12.2.1 小 节 开发 的 MyDjangoDBProj 项 目的 基础 
再 添加 如 下 的 代码 。 

01 在 urlspy 文件 中 添加 如 下 的 映射 关系 。 


EE; 


ownauwmewN 


叫 
-oo 


码 如 下 。 


uaw 必 wN 


from django .contrib import admin 
from django.urls import path 
from django.conf.urls import url 
from . import DBUtil 


urlpatterns = [ 


] 


path('admin/', admin.site.urls), 

url('^insert/$', DBUtil.insertStock), 
url('^insertMore/$', DBUtil.insertMoreStock), 
url('^getAll/$', DBUtil.getAllStock), 
url('^getSstockWithFilter/$', DBUtil.getStockWithFilter), 
url('^deleteStock/$', DBUtil.deleteStock), 
url('^updateStock/$', DBUtil.updatesStock), 


第 8 行 到 第 13 行 是 新 加 的 代码 , 其 中 定义 的 若干 格式 的 url 将 映射 到 DBUtil.py 文件 中 的 相关 
方法 。 为 了 调用 DBUtilpy 的 方法 ， 需 要 如 第 4 行 那样 用 import 导入 相关 类 。 


02 创建 DBUtilpy 文件 ， 该 文件 和 settings.py 与 urls.py 文件 在 同一 个 目录 中 ， 其 中 的 代 


# !/usr/bin/env python 

# coding=utf-8 

from django.http import HttpResponse 
from . import models 

def insertStock (request): 


stockInfo = models.stockInfo (date='20190101',open=10.0, 


close=10.5,high=10.7, low=10.3,vol=10,stockCode="'DemoCode') 


stockInfo.save () 
return HttpPpResponse ("OK!") 


在 insertStock 方法 内 的 第 6 行 中 ， 通 过 models.stock 的 方式 创建 了 一 个 stockInfo 对 象 ， 在 创 
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建 时 传 入 了 诸多 属性 的 值 ， 并 在 第 7 行 调 用 save 方法 把 该 model 对 象 存 入 MySQL 数据 表 。 
请 注意 ， 程 序 中 并 没有 直接 通过 数据 库 语句 插入 该 条 股票 信息 ， 而 是 通过 映射 关系 ， 以 “ 保 
存 Model 对 象 ”的 方式 插入 数据 。 这 样 做 的 目的 是 让 开发 者 无 须 关注 数据 库 底层 实现 的 细节 。 
9 def insertMoreStock (request) : 
10 stockInfoList=[] 


证 于 stockl = models.stockInfo (date='20190101'vopen=10.0,close=10.5,high=10.7， 
low=10.3,vol=10, stockCode='DemoCode') 


12 stockInfoList.append (stock]1) 

13 stock2 = models.stockInfo (date='20190102',open=10.5,close=11, 
high=11.2,1low=10.8, vol=12,stockCode='DemoCode') 

14 stockInfoList.append (stock2) 

二 mode1ls.stockInfo.objects.bulk_create (stockInfoList) 

16 return HttpPResponse ("OK!") 


在 往 数据 库 中 插入 多 条 记录 时 ， 如 果 针 对 每 条 记录 都 调用 save 方法 ， 一 来 代码 元 余 ， 二 来 会 
降低 数据 库 的 性 能 ， 所 以 在 insertMoreStock 方法 内 的 第 15 行程 序 语句 ， 是 通过 调用 bulk_create 方 
法 以 批量 的 方式 插入 多 条 记录 。 

请 注意 该 方法 的 参数 是 列表 (List) ， 在 第 12 行 和 第 14 行 的 程序 语句 分 别 把 两 条 stockInfo 
数据 记录 以 append 的 方式 存放 到 stockInfoList 中 。 在 批量 插入 数据 记录 时 ， 每 次 插入 的 条 数 不 能 
过 多 ， 一 般 每 次 100 条 。 

17 def deleteStock (request) : 
18 # 删除 所 有 数据 记录 


19 # models.stockInfo.objects.all() .delete() 

20 # 删除 指定 数据 记录 

2 models.stockInfo.objects.filter 
(date='20190101', stockCode='DemoCode') .delete () 

2 return HttpResponse ("OK!") 


在 deleteStock 方法 内 的 第 21 行程 序 语句 ， 首 先 调用 filter 方法 ， 按 参数 设置 的 条 件 找到 对 应 
股票 的 数据 记录 ， 再 调用 delete 方法 删除 它们 。 在 第 19 行 注释 掉 的 代码 中 ， 其 作用 是 直接 删除 数 
据 表 中 所 有 的 数据 记录 。 


23 def updateStock (request) : 
24 # 找到 数据 记录 并 更 新 


25 models .stockInfo.objects.filter (date='20190101',stockCode = 
'DemoCode') .update (open=12, close=13) 
26 return HttpResponse ("OK!") 


在 updateStock 方法 内 的 第 25 行程 序 语句 ， 首 先 也 是 调用 filter 方法 找到 对 应 的 数据 记录 ， 再 
调用 update 方法 把 对 应 的 数据 记录 更 新 成 为 参数 指定 的 数据 记录 。 


27 def getAllStock (request) : 


28 stockInfoList = models.stockInfo.objects.all () 

29 response = "" 

30 for stock in stockInfoList: 

31 response += 'stockCode is:' + stock.stockCode + ',date is:' + stock.date 


+',open is:' +str(stock.open)+',close is:'+str(stock.close)+'<br>"' 
32 return HttpResponse (response) 
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在 getAllStock 方法 内 的 第 28 行程 序 语句 ， 是 调用 all 方法 获取 stockInfo 数据 表 中 的 所 有 数据 
记录 ,并 通过 第 30 行 的 for 循环 , 依次 把 每 条 数据 记录 中 的 stockCode 等 属性 添加 到 response 对 象 
中 ， 请 注意 每 条 数据 记录 之 间 是 用 <br> 换 行 ， 最 后 在 第 32 行 返 回 response 对 象 。 


33 def getStockWithFilter (request) : 


34 stockInfoList = models.stockInfo.objects.filter (date='20190101') 

35 response = "" 

36 for stock in stockInfoList: 

37 response += 'stockCode is:' + stock.stockCode + ',date is:' + stock.date 
+',open is:' +str(stock.open)+',close is:'+str(stock.close)+'<br>"' 

38 return HttpResponse (response) 


在 第 33 行 的 getStockWithFilter 方法 中 , 通过 第 34 行 的 filter 方法 返回 符合 指定 条 件 的 数据 记 
录 ， 之 后 同样 是 通过 第 36 行 的 for 循环 逐条 打印 返回 的 结果 。 这 里 的 filter 条 件 只 有 一 个 ， 如 果 要 
带 多 个 参数 ， 请 参考 上 面 的 第 21 行程 序 语 句 ， 多 个 条 件 之 问 用 逗号 分 隔 。 

编写 完 上 述 代码 后 ， 以 带 “runserver localhost:8080” 参 数 的 方式 启动 manage.py 程序 ， 监 听 
localhost 的 8080 端口 ， 随 后 通过 如 下 的 url 来 验证 对 数据 库 的 增删 改 查 操 作 。 


EXI 输入 http://localhost:8080/insert/， 该 HTTP 请 求 会 触发 DBUtiLinsertStock 方法 向 
stockInfo 数据 表 中 插入 一 条 数据 记录 ， 结 果 如 图 12-3 所 示 。 


id date open close hieh low vol stockrode 


20190101 10 10.5 10.7 10.3 10 DemoCode 
图 12-3 插入 一 条 数据 记录 后 的 结果 


02 输入 http://localhost:8080/deleteStock/, 该 HTTP 请 求 会 触发 DBUtil.deleteStock 方法 删 
除数 据 记录 ， 执 行 完 成 之 后 ， 会 看 到 stockInfo 数据 表 内 的 数据 被 清空 。 

本 D03 输入 http:/localhost:808O/insertMore/, 该 HTTP 请 求 会 触发 DBUtilinsertMoreStock 方 
法 ， 向 stockInfo 数据 表 中 插入 两 条 数据 记录 ， 结 果 如 图 12-4 所 示 。 


id jaate |open |close [high [low vol |stockCode 


20190101 10 10.5 10.7 10.3 10 DemoCode 
3 20190102 10.5 11 11.2 10.8 12 DemoCode 


图 12-4 插入 两 条 数据 记录 后 的 结果 


CJT04 输入 http://localhost:8080/getAll/, 该 HTTP 请 求 会 触发 DBUtiLgetAllStock 方法 ,查找 
并 返回 stockInfo 表 中 的 所 有 数据 记录 ， 运 行 之 后 可 以 在 浏览 器 中 看 到 如 下 的 输出 。 


stockCode is:DemoCode,date is:20190101,open is:10.0,close is:10.5 
stockCode is:DemoCode,date is:20190102,open is:10.5,close is:11.0 


05 输 入 http://localhost:8080/getStockWithFilter/ ， 该 HTTP 请 求 会 触发 
DBUtil.getStockWithFilter 方法 ， 在 该 方法 中 通过 filter 传 入 的 条 件 , 返回 对 应 的 数据 记录 , 运行 后 可 
以 在 浏览 器 中 看 到 如 下 的 输出 。 


stockCode is:DemoCode,date is:20190101,open is:10.0,close is:10.5 


06 输入 http://localhost:8080/updateStock/ ,该 HTTP 请 求 会 触发 DBUtil.updateStock 方 法 ， 
ttp up 
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更 新 后 的 数据 记录 如 图 12-5 所 示 ， 其 中 open 值 设置 为 12，close 值 设置 为 13。 


lid date open close hieh low vol stockrode 
20190101 12 | 10.7 10.3 10 DemoCode 


图 12-5 更 新 后 的 数据 记录 


12.2.3 ”使 用 查询 条 件 获取 数据 


在 12.2.2 小 节 ， 讲 述 了 通过 filter 方法 传 入 查询 条 件 过 滤 数 据 的 用 法 ， 这 其 实 和 select 语句 中 
的 where 从 句 很 相似 ， 不 过 当时 实现 的 是 完全 匹配 ， 比 如 通过 如 下 的 filter 参数 ， 将 得 到 所 有 date 
是 20190101 的 数据 。 


stockInfoList = models.stockInfo.objects.filter(date='20190101') 


在 select 语句 的 where 从 句 中 ,可 以 通过 like 进行 模糊 匹配 的 查询 ,也 可 以 用 大 于 或 小 于 符号 
进行 范围 查询 ， 在 本 节 中 将 示范 此 类 用 法 。 

在 12.2.2 小 节 给 出 的 MyDjangoDBProj 项 目的 基础 上 ， 在 DBUtil.py 程序 代码 的 后 面 ， 再 加 上 
如 下 的 程序 代码 。 
def demoLike (request) : 

# 返回 包含 2019 的 股票 数据 

stockInfoList = models.stockInfo.objects.filter(date contains='2019') 

response = "" 

for stock in stockInfoList: 

response += 'stockCode is:' + stock.stockCode + ',date is:' + stock.date 

+',open is:' +str(stock.open)+',close is:'+tstr(stock.close)+'<br>' 
7 return HttpResponse (response) 


在 demoLike 方法 内 的 第 3 行程 序 语句 中 ， 在 filter 方法 内 的 参数 是 date _contains， 其 中 date 
是 字段 名 ，contains 表示 “包含 ”， 连 起 来 的 含义 等 价 于 where date like %2019%'， 即 返回 date 字 
段 中 包含 2019 的 股票 信息 。 


8 def demoStartswith (request): 


2 
3 
4 
-3 
6 


9 # 返回 以 2019 开头 的 股票 数据 

10 stockInfoList = models.stockInfo.objects.filter(date startswith='2019') 

11 response = "" 

12 for stock in stockInfoList: 

3 response += 'stockCode is:' + stock.stockCode + ',date is:' + stock.date 
+',open is:' +str(stock.open)+',close is:'+str(stock.close)+'<br>"' 

14 return HttpResponse (response) 

15 


16 def demoEndswith (request): 
7 # 返回 以 2019 结束 的 股票 数据 


18 stockInfoList = models.stockInfo.objects.filter(date endswith='2019') 
19 response = "" 

20 for stock in stockInfoList: 

21 response += 'stockCode is:' + stock.stockCode + ',date is:' + stock.date 


+',open is:' +str(stock.open)+',close is:'+str(stock.close)+'<br>"' 
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22 return HttpResponse (response) 
同 理 ， 在 第 8 行 的 demoStartswith 方法 内 的 第 10 行程 序 语句 中 ，filter 方法 的 参数 中 包含 了 
demoStartswith， 即 返回 date 字段 中 以 2019 开头 的 股票 信息 ， 这 等 价 于 where date like '2019%'。 
在 第 16 行 的 demoEndswith 方法 中 , 在 第 18 行 的 filter 方法 的 参数 中 包含 了 endswith， 即 返回 
date 字段 中 以 2019 结尾 的 股票 信息 ， 这 等 价 于 where date like '%2019'。 


23 def demoRange (request) : 
24 # 大 于 8， 小 于 12 


25 stockInfoList = models.stockInfo.objects.filter(open gt=8,open 1lt=12) 

26 # 大 于 等 于 8， 小 于 等 于 12 

2 # stockInfoList = models.stockInfo.objects.filter(open gte=8, 
open lte=12) 

28 response = "" 

29 for stock in stockInfoList: 

30 response += 'stockCode is:' + stock.stockCode + ',date is:' + stock.date 
+',open is:' +str(stock.open)+',close is:'+str(stock.close)+'<br>"' 

SE return HttpResponse (response) 


在 第 23 行 的 demoRange 方法 内 的 第 25 行程 序 语句 中 , 在 filter 方法 的 条 件 中 用 到 了 open__gt 
(gt 表示 大 于 ) 和 open_lt (lt 表示 小 于 ) ， 这 人 句 话 等 价 于 where open>8 and open<12， 而 第 27 行 
程序 语句 中 filter 方法 的 条 件 是 gte (大 于 等 于 ) 和 lte (小 于 等 于 ) ， 这 等 价 于 where open>=8 and 
open<=12。 
再 到 utls.py 中 添加 如 下 映射 规则 。 
url('^demoLike/$', DBUtil.demoLike), 
url('^demoStartswith/$', DBUtil.demoStartswith), 


url('^demoEndswith/$', DBUtil.demoEndswith), 
url('^demoRange/$', DBUtil.demoRange), 


同样 再 以 带 “runserver localhost:8080” 参 数 的 方式 启动 manage.py 程序 。 


CT01， 在 浏览 器 中 输入 http://localhost:8080/demoLike/, 在 如 下 执行 的 结果 中 能 看 到 类 似 SQL 
语句 中 like 操作 的 结果 。 

stockCode is:DemoCode,date is:20190101,open is:12.0,close is:13.0 

stockCode is:DemoCode,date is:20190102,open is:10.5,close is:11.0 

F002 输入 http://localhost:8080/demoStartswith/ ， 等 价 于 date like '2019%'， 和 上 述 调用 
demoLike 方法 的 结果 相同 。 

FI03 输入 http:/localhost8080/demoEndswith/， 等 价 于 date like %2019'， 无 数据 。 

GJ04 输入 http:/localhost8080/demoRange/， 会 得 到 open 介 于 8~12 之 间 ( 但 不 含 8 和 12 ) 
的 股票 数据 ， 结 果 如 下 所 示 。 

stockCode is:Democode,date is:20190102,open is:10.5,close is:11.0 

如 果 注 释 掉 第 25 行 的 程序 语句 ， 去 除 掉 第 27 行 的 注释 使 之 生效 ， 再 输入 
http://localhost:8080/demoRange/， 就 会 得 到 open 介 于 8~12 之 间 (同时 包含 8 和 12) 的 数据 ， 如 下 
所 示 。 和 之 前 gt 和 上 t 的 结果 相 比 ， 多 了 第 1 行 open 等 于 12 的 数据 。 
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stockCode is:DemoCode,date is:20190101,open is:12.0,close is:13.0 
stockCode is:DemoCode,date is:20190102,open is:10.5,close is:11.0 


12.2.4 以 SQL 语句 的 方式 读 写 数 据 库 


在 很 多 场合 中 , 可 以 像 12.2.3 小 节 所 述 那样 , 通过 调用 Model 类 的 filter 或 save 等 方法 来 读 写 
数据 库 ， 不 过 在 有 些 场合 中 ， 可 能 还 得 用 到 SQL 语句 。 

比如 在 select 语句 中 包含 group by 或 having 等 复杂 关键 字 ， 或 者 在 update 语句 中 包含 比较 复 
杂 的 where 条 件 。 这 时 单纯 调用 Model 类 的 相关 方法 就 不 大 方便 了 。 

下 面 将 演示 在 Django 框架 内 直接 通过 SQL 语句 访问 数据 库 ， 具 体 做 法 是 ,在 DBUtil.py 文件 
中 添加 如 下 代码 。 

机 from django .db import connection 

2 def demoSQL (request) : 

| cursor = connection.cursor() 

4 La 从 

5 Cursor.execute('select * from stockInfo') 
6 result=cursor.fetchall () 

. finally: 

8 cursor.close() 

9 return HttpResponse (result) 

在 第 1 行 导 入 所 需 的 库 , 在 第 2 行 的 demoSQL 方法 内 的 第 3 行程 序 语句 中 , 是 通过 connection 
对 象 得 到 cursor 游标 对 象 ， 在 第 5 行 中 通过 cursor 对 象 执行 了 一 条 SQL 语句 ， 并 在 第 6 行 把 读 取 
的 结果 赋值 给 result 对 象 。 

上 面 代码 中 执行 的 select 语句 ， 其 实 是 通过 第 5 行 的 cursor.execute 方法 。 当 然 ， 还 可 以 执行 
insert、delete 和 update 等 其 他 类 型 的 SQL 语句 。 最 后 在 第 9 行 通过 return 语句 返回 了 包含 结果 的 
result 对 象 。 

同时 ， 还 需要 在 urls.py 中 添加 触发 上 述 demoSQL 方法 的 映射 关系 ， 代 码 如 下 。 

url('^demoSsQL/$', DBUtil.demosQL), 

以 带 “runserver localhost:8080 ”参数 的 方式 启动 manage.py 程序 ， 在 浏览 器 中 输入 
http://localhost:8080/demoSQL/， 就 能 看 到 如 下 的 结果 。 这 说 明 通 过 直接 调用 方法 执行 SQL 语句 的 
方式 ， 就 可 以 从 数据 库 中 获取 数据 。 


(2, '20190101', 12.0, 13.0, 10.7, 10.3, 10, 'DemoCode') (3, '20190102', 10.5, 
11.0, 11.2, 10.8, 12, 'DemoCode') 


12.3 绘制 OBV 指标 图 


OBYV 指标 的 英文 全 称 为 On Balance Volume， 中 文 含义 是 平衡 交易 量 , 是 由 美国 的 投资 分 析 家 
乔 - 葛 兰 胞 (Joe Granville) 所 创造 。 具 体 而 言 ， 该 指标 是 将 成 交 量 量化 后 绘制 成 曲线 ， 再 结合 股价 
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的 上 涨 或 下 跌 的 趋势 ， 从 价格 变动 和 成 交 量 增 减 的 关系 中 ， 预 测 市 场 的 涨 跌 情 况 。 


12.3.1 OBYV 指标 的 原理 以 及 算法 


形象 地 讲 ，OBV 指标 是 将 成 交 量 与 股价 的 关系 数字 化 ， 并 根据 股市 成 交 量 的 变化 情况 来 衡量 
股市 上 涨 或 下 跌 的 支持 力 ， 以 此 来 研判 股价 的 走势 。OBYV 指标 的 设计 是 基于 如 下 的 原理 。 


(1) 如 果 投资 者 对 当前 股价 的 看 法 越 有 分 歧 ， 那 么 成 交 量 就 越 大 ， 反 之 成 交 量 就 越 小 ， 所 以 
可 以 用 成 交 量 来 衡量 多 空 双方 的 力量 。 

(2) 股价 在 上 升 时 ,尤其 是 在 上 升 初期 必须 要 较 大 的 成 交 量 相配 合 ; 相反 ， 股 价 在 下 跌 时 ， 
无 须 耗 费 很 大 的 动量 ， 因 此 成 交 量 未 必 放 大 ， 甚 至 下 跌 阶段 成 交 量 会 有 萎缩 趋势 。 

(3) 受 关注 的 股票 在 一 段 时 间 内 成 交 量 和 股价 波动 会 很 大 ， 而 冷门 股票 的 成 交 量 和 价格 波动 
会 比较 小 。 


根据 上 述 原 则 ，OBYV 的 算法 如 下 ， 主 要 是 以 日 为 单位 累积 成 交 量 。 
当日 OBV 值 = 本 日 值 十 前 日 OBV 值 


如 果 本 日 收盘 价 高 于 前 一 日 的 收盘 价 ， 本 日 的 值 为 正 ， 反 之 为 负 ， 如 果 本 日 收盘 价 和 前 一 日 
的 收盘 价 相 同 ， 则 本 日 值 不 参与 计算 , 按照 这 种 规则 累积 计算 成 交 量 。 成 交 量 可 以 选择 多 种 计算 单 
位 ，OBYV 用 到 的 是 成 交手 数 。 参 考 表 12-3， 通 过 范例 来 了 解 一 下 OBV 的 算法 。 
表 12-3 OBV 指标 算法 的 实例 表 
收盘 价 〈 元 ) | 成交 量 ( 手 ) 


| 第 天 [0 | | 和 ii 算 | 


-10000 
[第 天 | js js | 


其 中 , 第 一 天 不 计算 , 第 2 天 的 收盘 价 高 于 第 1 天 ,所 以 当日 OBV 是 当日 成 交 量 (为 正 数 ) 。 
第 3 天 收盘 价 也 高 于 第 2 天 , 所 以 该 日 的 OBV 是 第 2 天 的 值 (+11000) 加 上 该 日 成 交 量 (+12000) 。 

第 4 天 股票 下 跌 , 所 以 当日 的 OBV 累计 值 是 前 日 的 23000 减 去 当日 的 成 交 量 , 结果 是 +13000， 
同 理 第 5 天 也 是 下 跌 ， 当 日 的 OBV 是 前 日 值 13000 减 去 当日 成 交 量 5000， 结 果 是 8000 。 

之 后 的 OBV 值 按 同 理 计 算 ， 将 每 日 算得 的 OBV 值 作为 纵 坐标 ， 交 易 的 日 期 作为 横 坐 标 ， 将 
这 些 点 连接 起 来 就 是 OBV 指标 线 了 。 


12.3.2 ”绘制 K 线 、 均 线 和 OBYV 指标 图 的 整合 效果 图 


在 绘制 K 线 、 均 线 与 OBV 指标 图 时 ， 是 从 csv 文件 (其 实 源 于 网 站 息 取 的 股票 交易 数据 〉 中 
的 Volume 字段 获得 的 成 交 量 ， 它 的 单位 是 “ 股 数 ”， 而 计算 OBV 时 成 交 量 的 单位 是 “ 手 ”， 两 
者 的 对 应 关系 是 1 手 等 于 100 股 。 
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在 DrawKwithOBV.py 范例 程序 中 , 将 绘制 整合 的 效果 图 , 该 范例 程序 存放 在 MyDjangoDBProj 
项 目 中 ， 与 DBUtil.py 处 于 同一 目录 。 为 了 突出 OBV 算法 ， 范 例 程序 不 导入 数据 库 相 关 的 操作 ， 
也 不 输出 日 志 。 


刘 # !/usr/bin/env Python 

2 # coding=utf-8 

) import pandas as pd 

4 import matplotlib.pyplot as plt 

于 from mpl _ finance import candlestick2 ochl 

6 “## 计算 oBv 的 方法 

7 def calOBV (df): 

8 # 把 成 交 量 换算 成 万 手 

9 df['VolByHand'] = df['Volume']/1000000 

10 # 创建 OBV 列 ， 先 全 填充 为 0 

2 df['OBV'] =0 

12 cnt=1 ”# 索引 从 1 开始 ， 即 从 第 2 天 算 起 

3 while cnt<=len (df)-1: 

14 if(df.iloc[cnt] ['Close']>df.iloc[cnt-1] ['Close']): 

15. df.ix[cnt,'OBV'] = df.ix[cnt-1,'OBV'] + df.ix[cnt,'VolByHand'] 
16 if(df.iloc[cnt] ['Close']<df.iloc[cnt-1] ['Close']): 

往 浅 df.ix[cnt, 'OBV'] = df.ix[cnt-1,'OBV'] - df.ix[cnt,'VolByHand'] 
18 cnt=cnt+1 

a return df 


在 第 7 行 的 calOBYV 方法 中 封装 了 计算 OBV 指标 的 程序 逻辑 。 具 体 执行 步骤 是 ， 在 第 9 行 中 
为 df 对 象 新 增 VolByHand 列 ， 把 成 交 量 转换 成 “万 手 ”， 虽 然 OBV 的 计算 单位 是 手 ， 但 以 此 绘 
制 出 来 的 指标 图 上 y 轴 的 OBV 数值 还 是 过 大 ， 所 以 这 里 在 除 以 100 的 基础 上 再 除 以 10000， 转 换 
成 “万 手 ”。 

随后 在 第 11 行 新 增 OBV 列 ， 该 列 的 初始 值 是 0。 之 后 在 第 13 行 的 while 循环 中 ， 从 第 2 天 
开始 依次 遍历 df 对 象 ， 根 据 OBV 的 计算 规则 给 每 天 的 OBV 列 赋值 ， 比 如 通过 第 14 行 的 让 语句 
处 理 当天 收盘 价 上 涨 的 情况 ， 从 第 15 行 的 程序 代码 中 可 以 看 到 ， 在 上 涨 情况 下 ， 当 日 的 OBV 值 
是 前 日 OBV 值 加 上 当日 的 成 交 量 , 在 第 17 行 中 处 理 了 当日 下 跌 的 情况 ， 当 日 的 OBYV 值 是 前 日 值 
减 去 当日 的 成 交 量 。 
20 filename='D:\\stockData\ch12\\6004602019-01-012019-05-31.csv' 
21 df = pd.read csv(filename,encoding="'gbk') 
22 ，# 调用 方法 计算 OBV 
23 df = calOBV (df) 
24 # print(df) # 可 以 去 除 这 段 注释 以 查看 结果 

在 第 21 行 从 指定 的 csv 文件 中 读 到 600460〈 士 兰 微 ) 从 20190101 到 20190531 的 交易 数据 ， 
并 在 第 23 行 调用 calOBYV 方法 计算 OBV 值 , 在 该 方法 的 返回 结果 存放 到 df 对 象 中 , 其 中 OBV 值 
包含 在 df['OBV'] 这 一 列 中 。 如 果 要 检验 计算 的 OBV 结果 ， 可 以 去 掉 第 24 行 的 注释 ， 使 得 打印 语 
句 生 效 。 
25 figure = plt.figure() 


26 ”# 创建 子 图 
27 (axPrice, axOBV) = figure.subplots (2，sharex=True) 
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28 ”# 调用 方法 ， 在 axPrice 子 图 中 绘制 K 线 图 


29 candlestick2 ochl (ax = axPrice, 


30 opens=df["Open"] .values, closes=df["Close"] .values, 
3 highs=df["High"] .values, lows=df["Low"] .values, 
32 width=0.75, colorup='red', colordown="'green') 


33 axPrice.set title("K 线 图 和 均线 图 ")  # 设置 子 图 标题 

34 df['Close'] .rolling (window=3) .mean () .plot (ax=axPrice,color="red",1label="'3 
日 均线 ') 

35 dfl['Close'] .rolling (window=5) .mean() .plot (ax=axPrice,color="blue",label='5 
日 均线 ') 

36 dfl['Close'] .rolling (window=10) .mean() .plot (ax=axPrice, 
color="green",1label='10 日 均线 ') 


37 axPrice.legend(loc='best') # 绘制 图 例 
38 axPrice.set ylabel ("价格 (单位: 元 ) ") 
39 axPrice.grid(linestyle='-.') # 带 网 格 线 


40 ”# 在 axOBV 子 图 中 绘制 OBV 图 形 

41 df['OBV'] .plot (ax=axOBV,color="blue",label="'OBV') 
42 plt.legend(loc='best') # 绘制 图 例 

43 plt.rcParams['font.sans-serif']=['SimHei'] 

44 ”# 在 OBV 子 图 上 加 上 负 值 效果 

45 plt.rcParams['axes.unicode minus'] = False 

46 ”axOBV.set_ylabel ("单位 : 万 手 ") 

47 ”axOBV.set title ("OBV 指标 图 ") # 设置 子 图 的 标题 
48 axOBV.grid(linestyle='-.') # 带 网 格 线 

49 ”# 设置 x 轴 坐标 的 标签 和 旋转 角度 

50 major index=df.index[df.index%5==0] 

51 major xtics=df['Date'] [df.index%5==0] 

52 plt.xticks (major index,major xtics) 

53 plt.setp(plt.gca().get xticklabels(), rotation=30) 
54 plt.show() 


在 第 27 行 的 程序 语句 设置 了 两 个 子 图 ， 其 中 axPrice 用 于 绘制 K 线 和 均线 , 而 axOBV 则 用 于 
绘制 OBV 指标 图 。 
从 第 29 行 到 第 39 行 的 程序 语句 用 于 绘制 K 线 以 及 三 条 均线 ， 这 部 分 代码 在 之 前 几 章 中 的 范 
例 程序 中 都 讲 过 ,所 以 不 再 重复 说 明 。 在 第 41 行 中 通过 调用 dffOBV'].plot 方法 绘制 OBV 指标 图 。 
在 绘制 OBV 子 图 时 请 注意 两 个 细节 : 
(1) 在 第 46 行 中 , 在 axOBYV 子 图 内 通过 调用 set_ylabel 方法 设置 了 OBV 子 图 的 y 坐标 标签 
为 “万 手 ”。 
(2) 通过 第 45 行 的 程序 代码 ， 让 OBV 子 图 上 的 y 坐标 数字 有 正 有 负 ， 如 果 去 掉 这 行 语句 ， 
OBV 子 图 上 y 坐标 的 数字 均 为 正 数 。 
运行 这 个 范例 程序 ， 即 可 看 到 如 图 12-6 所 示 的 执行 结果 。 
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加 12-6 ”OBYV 指标 图 与 K 线 、 均 线 整合 后 的 效果 图 


12.4 在 Django 框架 内 整合 日 志 与 数据 库 


在 前 面 的 章节 中 ， 讲 述 了 在 Django 框架 内 引入 日 志和 连接 MySQL 数据 库 的 用 法 ， 也 讲述 了 
OBYV 指标 图 的 绘制 方式 , 在 本 节 中 还 将 以 OBV 指标 为 范例 ,演示 一 下 Django 整合 MVC、 日 志 与 
数据 库 的 用 法 。 


12.4.1 搭建 Django 环境 


首先 创建 名 为 MyDjangoOBVProj 的 基于 Django 的 项 目 ， 在 其 中 实现 上 述 整合 功能 ， 在 绘制 
OBYV 指标 之 前 ， 先 通过 如 下 的 步骤 设置 日 志和 数据 库 的 相关 配置 。 


(1) 在 src 目录 下 创建 log 目录 ， 并 在 其 中 新 建 myLog.log 文件 来 存放 日 志 信息 。 随 后 ， 在 
settings.py 文件 中 新 加 配置 针对 日 志 输 出 的 LOGGING 元 素 ， 这 部 分 代码 和 12.1.2 小 节 范 例 程序 内 
的 代码 很 相似 , 读者 可 以 参考 本 书 提供 下 载 的 完整 源 代码 , 这 里 就 不 再 详细 给 出 了 。 读 者 在 看 源 代 
码 的 时 候 就 能 看 到 ， 在 其 中 的 loggers 子 元 素 中 ， 不 再 有 'error 部 分 ， 这 是 因为 ， 已 经 把 各 种 级 别 
的 日 志 统 一 输出 到 myLog.log 文件 中 了 。 

(2) 在 settings.py 中 修改 DATABASES 配置 项 ， 以 配置 和 MySQL 数据库 的 连接 ， 这 部 分 的 
代码 和 12.2.1 小 节 的 范例 程序 内 的 代码 完全 一 致 。 

(3) 在 settings.py 文件 的 INSTALLED_APPS 元 素 中 添加 本 项 目 名 'MyDjangoOBVProj'。 

(4) 在 manage.py 和 init _.py 程序 文件 中 添加 如 下 两 行 代码 ， 以 用 PyMySQL 库 来 连接 
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MySQL。 


import pymysql 
pymysql.install as MySQLdb() 


(5) 在 与 settings.py 同 级 的 目录 中 ,创建 modelspy， 其 中 的 代码 和 12.2.1 小 节 的 范例 程序 内 
的 代码 一 致 ， 以 此 和 MySQL 的 stockInfo 数据 表 建 立 关 联 关系 。 


至 此 ， 就 完成 了 对 日 志和 数据 库 的 配置 。 
12.4.2 ”把 数据 插入 到 数据 表 中 【〈 含 日 志 打 印 ) 
JT01 在 MyDjangoOBVProj 项 目的 urlspy 文件 中 建立 url 和 处 理 方法 的 映射 关系 ， 具 体 代 


码 如 下 ， 其 中 mainForm 和 mainAction 的 两 种 格式 的 请 求 ， 分 别 会 用 mainForm.py 中 对 应 的 两 个 方 
法 来 处 理 。 


from django .contrib import admin 

from django .urls import path 

from django.conf.urls import url 

from . import mainForm 

urlpatterns = [ 
path('admin/', admin.site.urls), 
url('^mainForm/$', mainForm.display), 
url('^mainAction/$', mainForm.draw) 


ownaouwmewn 


] 
人 创建 和 urls.py 平 级 的 templates 目录 ， 并 在 其 中 编写 main.html 文件 ， 代 码 如 下 。 


<html> 
<meta charset="utf-8"> 
<head> 
<title> 分 析 股 票 </title> 
</head> 
<body> 
<form name="mainForm" action="/mainAction/" method="POST"> 
{% csrf token %} 
<table> 
0 <tr> 
<td> 股 票 代码 :</td> 
<td><input type="text" name="stockCode" id="stockCode" 
value="600007"/></td> 
</tr> 
<tr> 
<td> 开 始 时 间 </td> 
<td><input type="text" name="startDate" id="startDate" 
value="2019-01-01" /></td> 
</tr> 
<tr> 


<td> 结 束 时 间 </td> 
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上 
Dp 
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FF 
wo 


第 12 章 以 OBV 范例 深入 讲述 Django 框架 | 247 


20 <td><input type="text" name="endDate" id="endDate" 
value="2019-05-31" /></td> 

下 </tr> 

22 x 

妾 3 <td colospan="2" align="center"> 

24 <input type="submit" name="submit" value=" 提 交 " />gnbsp; gnbsp; 

25 <input type="reset" name="reset" value=" 重 置 " /> 

26 </td> 

27 </tr> 

28 </table> 

29 </form> 

30 </body> 

31 </html> 
在 第 7 行 的 Form 表单 中 ， 是 用 三 个 文本 框 来 接收 股票 代码 、 开 始 时 间 和 结束 时 间 这 三 个 值 ， 

且 它们 均 有 默认 值 。 单 击 第 24 行 的 “提交 ”按钮 , 会 以 POST 的 方式 发 送 名 为 mainAction 的 请 求 。 


在 templates 目录 中 创建 stock.html, 代码 如 下 。 其 中 在 第 7 行 , 根据 传 来 的 参数 显示 股票 代码 ， 


在 第 8 行 中 ， 根 据 传 来 的 img 数据 流 显示 Matplotlib 格式 的 图 片 。 


1 <html> 
2 <meta charset="utf-8"> 
3 <head> 
4 ”<title> 以 OBV 指标 分 析 股 票 </title> 
5 </head> 
6 <body> 
7 股票 代码 : { { stockCode }}<br> 
8 <img src="{{ img }}"> 
9 </body> 
10 </html> 
TI03 在 urlspy 同 级 的 目录 中 创建 mainForm.py 文件 , 在 其 中 定义 跳 转 以 及 绘制 OBV 指标 
的 程序 代码 ， 其 中 引入 了 日 志和 数据 库 ， 由 于 程序 代码 比较 长 ， 下 面 分 段 说 明 。 
1 # !/usr/bin/env Python 
2 # coding=utf-8 
习 from django .shortcuts import render 
三 import pandas datareader 
5 import matplotlib.pyplot as plt 
6 import pandas as pd 
人 from mpl finance import candlestick2 ochl 
8 import sys 
9 from io import BYytesIO 
10 import base64 
11 import imp 
12 from . import models 
13 imp.reload(sys) 
14 import logging 
15 from django.db import connection 
16 # 引用 django 日 志 实例 
17 logger = logging.getLogger( name ) 
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18 

19 def display (request): 

20 logger.infol("start to display main.html") 
2 return render(request, 'main.html') 


从 第 3 行 到 第 15 行 导入 所 需 的 库 , 其 中 在 第 14 行 导入 了 日 志 库 ,在 第 15 行 导入 了 连接 MySQL 
所 需 的 connection 库 。 在 第 17 行 中 定义 了 日 志 的 实例 。 

在 第 19 行 的 display 方法 中 通过 在 第 21 行 调用 render 方法 ， 跳 转 到 main.html 页 面 ， 同 时 请 
注意 在 第 20 行 ， 通 过 INFO 级 别 的 日 志 来 记录 该 方法 的 执行 时 间 。 
22 # 计算 oBV 的 方法 
23 def calOBV (df): 
人 
2 return df 

第 23 行 定义 的 calOBV 方法 和 12.3.2 小 节 的 范例 程序 内 的 同名 方法 完全 一 致 ， 在 此 不 再 重复 
说 明 。 在 第 25 行 返回 的 df 对象 中 包含 了 OBV 值 。 


26 def insertData(stockCcode, startDatevendDate) : 


27 1ogger.info("start insertData") 

28 # 先 删除 

29 models.stockInfo.objects.filter(stockCode=stockCcode) . delete() 

30 stock = pandas_datareader.get_data_yahoo (stockCode+' .ss'v 
startDate,endDate) 

31 # 删除 最 后 一 天 多 余 的 股票 交易 数据 

32 stock.drop (stock.index[len(stock)-1],inplace=True) 

33 filename='D:\\stockData\ch12\\'+stockCodetstartDate+ endDate+'.csv' 

34 stock.to csv (filename) 

区 stock = pd.read csv(filename,encoding='gbk') 

36 cnt=0 

37 # 存 入 数据 库 

38 stockInfoList=[] 

39 while cnt<=len(stock)-1: 

40 date=stock.iloc[cnt]['Date'] 

41 open=float (stock.iloc[cnt] ['Open']) 

42 close=float (stock.iloc[cnt] ['Close']) 

43 high=float (stock.iloc[cnt] ['High']) 

44 low=float (stock.iloc[cnt] ['Low']) 

45 vol=int (stock.iloc[cnt] ['Volume']) 

46 stockone = models.stockIinfo (date=date, open=open, close=close, 
high=high, low=low, vol=vol,stockCode=stockCode) 

47 stockInfoList.append (stockOne) 

48 cnt=cnt+1 

49 models.stockInfo.objects.bulk_create (stockInfoList) 

50 return stock 

5 

52 def loadStock(stockCode,startDate,endDate): 

S53 logger .info("start loadSstock") 


54 # 先 从 数据 表 中 获取 数据 


55 cursor = Connection.cursor () 
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56 trye 

全 cursor.execute ("select date,high,1low,open,close,vol from stockInfo 
where stockCode='"+stockCode+"' and date>='"+SstartDate+"' and 
date<='"+endDate+"'") 


58 heads = ['Date','High','Low','Open','Close','Volume'] 
59 # 依次 把 每 个 cols 元 素 中 的 第 一 个 值 放 入 col 数组 

60 result = cursor.fetchall () 

61 df = pd.DataFrame (list (result)) 

62 except: 

63 logger.error("in loadStock,error during visiting stockInfo table") 
64 finally: 

65 cursor.close () 

66 # 数据 表 中 存在 数据 ， 则 从 数据 表 中 读 取 

67 if(len(df)>0) : 

68 df.columns=heads 

69 return df; 

70 # 如 果 没 有 读 取 到 ， 则 从 网 站 疏 取 ， 并 插入 数据 表 中 

区 else: 

We logger.info("No data in DB, get from Web") 

73 df = insertData(stockCode, startDate, endDate) 

74 return df 


在 之 后 绘制 图 形 的 draw 方法 中 会 调用 第 52 行 的 loadStock 方法 获取 股票 数据 。 有 具体 而 言 ， 先 
从 第 55 行 获得 游标 对 象 ， 并 在 第 57 行 通过 游标 cursor 对 象 执行 一 条 select 语句 ， 根 据 传 入 的 
stockCode，startDate 和 endDate 值 ， 从 stockInfo 数据 表 中 获得 股票 数据 。 

如 果 通 过 第 67 行 的 让 语句 判断 数据 表 中 存在 所 需 的 数据 ， 则 通过 第 69 行 返回 找到 的 数据 ， 
如 果 数 据 不 存在 ， 则 在 第 73 行 的 代码 中 调用 insertData 方法 从 网 站 息 取 数据 ， 再 插入 到 stockInfo 
数据 表 中 。 

insertData 方法 是 在 第 26 行 定 义 的 ， 它 的 具体 执行 步骤 是 : 先 通过 第 30 行 的 代码 从 网 站 疏 取 
股票 数据 ， 随 后 在 第 34 行 把 数据 保存 到 csv 文件 中 ， 再 通过 第 39 行 的 while 循环 ， 依 次 把 每 行 数 
据 〈 即 每 个 交易 日 的 数据 ) 放 入 stockInfoList 对 象 中 ， 而 后 通过 调用 第 49 行 的 bulk_create 方法 ， 
一 次 性 把 所 有 股票 数据 插入 到 stockInfo 数据 表 中 ， 最 后 再 返回 包含 股票 数据 的 df 对象。 


75 def draw(request) : 


76 logger.info("start draw") 

77 # 获取 页 面 参数 

78 stockCode = request.POST.get('stockCode') 
79 logger.info("stockCode is:" + stockCode) 
80 startDate = request.POST.get ('startDate') 
81 logger.info("startDate is:" + startDate) 
82 endDate = request.POST.get ('endDate') 

83 logger.info("endDate is:" + endDate) 

84 # 获取 股票 数据 

85 df = loadStock (stockCode, startDate, endDate) 
86 # 计算 OBV 值 

87 df = calOBV (df) 

88 


89 figure = plt.figure() 
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90 # 创建 子 图 


91 (axPrice, axOBV) = figure.subplots(2, sharex=True) 

92 # 调用 方法 ， 在 axPrice 子 图 中 绘制 K 线 图 

93 candlestick2 ochl(ax = axPrice, 

94 opens=df["Open"] .values, closes=df["Close"] .values, 

95 highs=df["High"] .values, lows=df["Low"] .values, 

96 width=0.75, colorup="'red', colordown="'green') 

97 axPrice.set title("K 线 图 和 均线 图 ")  # 设置 子 图 标题 

98 df['Close'] .rolling (window=3) .mean () .plot (ax=axPrice,color="red", 
labe1='3 日 均线 ') 

99 df['Close'] .rolling (window=5) .mean() .plot (ax=axPrice,color="blue", 
label1='5 日 均线 ') 

100 df['Close'] .rolling (window=10) .mean() .plot (ax=axPrice,color="green", 
labe1='10 日 均线 ') 

101 axPrice.legend (loc='best') # 绘制 图 例 


102 axPrice.set ylabel ("价格 (单位: 元) ") 

103 axPrice.grid(linestyle='-.') # 带 网 格 线 

104 # 在 axOBV 子 图 中 绘制 OBV 图 形 

105 df['OBV'] .plot (ax=axOBV, color="blue", label='OBV') 


106 plt.legend(loc='best') # 绘制 图 例 
107 Plt.rcParams['font.sans-serif']=['SimHei'] 
108 # 在 OBV 子 图 上 加 上 负 值 效果 

109 Plt.rcParams['axes.unicode minus'] = False 


110 axOBV.set _ylabel ("单位 : 万 手 ") 
axOBV.set title ("OBV 指标 图 ") # 设置 子 图 的 标题 


TL axOBV.grid(linestyle='-.') # 带 网 格 线 

Ws # 设置 x 轴 坐 标的 标签 和 旋转 角度 

114 major index=df.index[df.index%5==0] 

kh major xtics=df['Date'] [df.index%5==0] 

116 Plt.xticks (major index,major xtics) 

117 Plt.setp(plt.gca() .get xticklabels(), rotation=30) 
118 logger.debug ("convert plt to buffer") 


119 buffer = BytesIO() 
120 plt.savefig (buffer) 
121 plt.close() 


122 base64img = base64.b64encode (buffer.getvalue () ) 
E23 img = "data:image/png;base64,"+base64img.decode() 
124 logger.debug("start to Render in stock.html") 

125 return render (request， 'stock.html', { 

126 'img': img,'stockCode':stockCode}) 


在 第 75 行 的 draw 方法 中 ， 首 先 通过 第 78 行 到 第 82 行 的 程序 代码 ， 获 取 从 main.html 页 面 以 
POST 方式 传 来 的 股票 代码 、 开 始 时 间 和 结束 时 间 ， 再 通过 调用 第 85 行 的 loadStock 方法 获取 股票 
数据 。 

前 文 已 经 讲述 了 loadStock 方法 的 执行 过 程 ， 先 从 stockInfo 数据 表 中 根据 股票 代码 、 开 始 时 间 
和 结束 时 间 去 查找 ， 如 果 找 到 就 直接 返回 ， 如 果 没 有 找到 ， 就 从 网 站 去 爬 取 ,， 怜 取 到 股票 数据 后 再 
插入 到 stockInfo 数据 表 中 。 

在 获得 股票 数据 后 ， 再 通过 调用 第 87 行 的 calOBYV 方法 计算 OBV 值 ， 随 后 通过 第 89 行 到 第 
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117 行 的 程序 代码 绘制 该 股票 的 K 线 、 均 线 和 OBYV 指标 的 整合 图 。 这 部 分 绘制 图 形 的 程序 代码 和 
12.3.2 小 节 的 范例 程序 内 绘制 图 形 的 程序 代码 很 相似 , 只 不 过 最 后 不 是 调用 plt.show 方法 进行 绘制 ， 
而 是 通过 第 119 行 到 第 123 行 的 程序 代码 把 图 形 以 base64 编码 的 形式 放 入 img 对 象 中 ， 最 后 通过 
第 125 行 的 程序 语句 ， 携 带 包含 股票 代码 的 stockCode 对 象 和 包含 图 形 二 进 制 流 的 img 对 象 ， 跳 转 
到 stock.html 页 面 。 

同时 ， 请 注意 在 上 述 方法 中 的 日 志 打印 语句 ， 一 般 在 进入 方法 时 ， 会 打印 INFO 级 别 的 日 志 ， 
在 第 63 行 ， 当 触发 exception 时 ， 会 打印 ERROR 级 别 的 日 志 ， 为 了 在 本 地 调试 时 ， 确 保 图 形 转 换 
成 流 ， 并 发 送 到 stock.html 页 面 ， 所 以 在 第 118 行 和 第 124 行 打印 了 DEBUG 级 别 的 日 志 。 

编写 完 上 述 程序 代码 之 后 ， 以 带 “runserver localhost:8080” 参 数 的 方式 启动 manage.py 程序 ， 
在 浏览 器 中 输入 http://localhost:8080/mainForm/， 即 可 看 到 如 图 12-7 所 示 的 结果 。 


股票 代码 : 600007 
开始 时 间 2019-01-01 


结束 时 间 (2019-05-31 
| 提交 | | 重 轩 | 


图 12-7 用 于 输入 股票 代码 、 开 始 时 间 和 结束 时 间 的 页 面 
在 其 中 可 以 更 改 股票 代码 ， 也 可 以 更 改 时 间 ， 不 过 在 本 文中 使 用 默认 值 。 此 时 ，MySQL 数据 
库 中 的 stockInfo 表 内 没有 数据 。 单 击 “ 提 交 ” 按 钮 后 ， 就 会 看 到 如 图 12-8 所 示 的 页 面 。 


票 代码 :600007 


K 线 图 和 均线 图 


- - 
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图 12-8 含 K 线 、 均 线 和 OBV 指标 图 的 页 面 


同时 ， 可 以 在 MySQL 数据 库 的 stockInfo 数据 表 中 看 到 相应 股票 代码 在 相应 日 期 范围 内 的 股 
票 交易 数据 。 另 外 ， 还 可 以 在 myLog.log 文件 中 看 到 如 下 和 该 范例 程序 相 匹配 的 日 志 , 尤其 是 从 下 
面 第 6 行 到 第 8 行 的 日 志 可 以 看 到 ， 在 调用 loadStock 方法 时 ， 由 于 数据 表 中 没有 数据 ， 因 此 调用 
了 insertData 方法 从 网 站 去 息 取 股票 数据 。 


1 [2019-07-24 21:54:29,140] [Thread-2:1444] [task id:MyDjangoOBVProj .mainForm] 
[INFO] start to display main.html 
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总 [2019-07-24 21:59:56,296] [Thread-5:3024] [task id:MyDjangoOBVProj .mainForm] 
[INFO] start draw 

3 [2019-07-24 
21:59:56,296] [Thread-5:3024] [task id:MyDjangoOBVProj .mainForm] [INFO] 
stockCode is:600007 

4 [2019-07-24 21:59:56,296] [Thread-5:3024] [task_id:MyDjangoOBVProj .mainForm] 
[INFO] startDate is:2019-01-01 

3 [2019-07-24 21:59:56,296] [Thread-5:3024] [task id:MyDjangoOBVProj .mainForm] 

INFO] endDate is:2019-05-31 

6 2019-07-24 21:59:56,296] [Thread-5:3024] [task id:MyDjangoOBVProj .mainForm] 

[INFO] start loadStock 

wv 2019-07-24 21:59:56,312] [Thread-5:3024] [task id:MyDjangoOBVProj .mainForm 

INFO] No data in DB, get from Web 

8 2019-07-24 21:59:56,312] [Thread-5:3024] [task id:MyDjangoOBVProj .mainForm] 

INFO] start insertData 

9 2019-07-24 22:01:28,437] [Thread-5:3024] [task id:MyDjangoOBVProj .mainForm] 

INFO] start calOBV 


执行 网 站 疏 取 数据 之 后 ， stockInfo 数据 表 中 就 有 了 股票 数据 ， 如 果 回 到 main.html 页 面 再 次 
单 击 “ 提 交 ” 按 钮 ， 就 能 看 到 和 图 12-8 所 示 相 同 的 结果 ， 只 不 过 ， 这 次 从 myLog.log 文件 中 看 到 
的 日 志 情况 稍 有 不 同 。 


1 2019-07-24 22:05:25,656] [Thread-6:4048] [task_id:MyDjangoOBVProj .mainForm] 
[INFO] start to display main.html 

癌 2019-07-24 22:05:27,281] [Thread-7:5024] [task id:MYyDjangoOBVProj .mainForm] 
INFO] start draw 

3 2019-07-24 22:05:27,281] [Thread-7:5024] [task id:MyDjangoOBVProj .mainForm] 
INFO] stockCode is:600007 

4 2019-07-24 22:05:27,281] [Thread-7:5024] [task id:MyDjangoOBVProj.mainForm] 
INFO] startDate is:2019-01-01 

5 [2019-07-24 22:05:27,281] [Thread-7:5024] [task id:MyDjangoOBVProj .mainForm] 
INFO] endDate is:2019-05-31 

6 2019-07-24 22:05:27,281] [Thread-7:5024] [task_id:MyDjangoOBVProj .mainForm] 
INFO] start loadStock 

轩 2019-07-24 22:05:27,281] [Thread-7:5024] [task_id:MyDjangoOBVProj .mainForm] 
INFO] start calOBV 


从 第 6 行 和 第 7 行 的 日 志 情 况 来 看 ， 由 于 数据 表 中 存在 数据 ， 因 此 loadStock 方法 并 没有 调用 
insertData 方法 ， 而 是 直接 返回 。 
DEBUG 级 别 的 日 志 输 出 到 控制 台 上 ， 如 下 所 示 ， 这 也 是 和 范例 程序 中 的 程序 代码 相符 合 的 。 


而 [2019-07-24 22:05:27,703] [DEBUG] convert plt to buffer 
六 [2019-07-24 22:05:27,937] [DEBUG] start to Render in stock.html 


12.4.3 ”验证 基于 OBV 指标 的 买卖 策略 


根据 之 前 讲述 的 OBV 指标 的 算法 ， 针 对 OBV 的 交易 策略 是 比较 多 的 ， 因 为 本 书 的 核心 还 是 
学 习 Python 语言 的 知识 ， 所 以 仅 给 出 如 下 的 买卖 策略 。 
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(1) 当 OBV 指标 下 降 但 股价 上 升 ， 说 明 股票 上 升 动 力 不 足 ， 股 价 可 能 随时 下 跌 ， 是 卖 出 信 
号 。Python 程序 的 具体 实现 是 ， 收 盘 价 连续 两 天 上 涨 ， 但 OBV 指标 连续 两 天 下 跌 。 

(2) 反之 ， 当 OBV 上 升 但 股票 下 降 ， 说 明 股票 支撑 力 比 较 强 ， 之 后 反弹 的 可 能 性 比较 大 。 
Python 程序 的 实现 是 ， 收 盘 价 连续 两 天 下 跌 ， 但 OBV 连续 两 天 上 涨 。 


在 MyDiangoOBVProj 项 目 中 ， 通 过 如 下 的 步骤 改写 mainForm.py 和 stock.html 来 实现 上 述 交 
易 策 略 。 在 mainForm.py 中 ， 改 写 如 下 代码 。 


修改 点 1: 增加 计算 买点 的 calBuyPoints 方法 和 计算 卖点 的 方法 calSellPoints， 代 码 如 下 。 


1 def calBuyPoints (df): 

权 cnt=0 

3 buyDate="" 

4 while cnt<=len(df)-1: 

5 if (cnt>=5) : # 前 几 天 有 误差 ， 从 第 5 天 算 起 

6 # 买点 规则 : 股价 连续 两 天 下 跌 ， 而 OBV 连续 两 天 上 涨 

了 if df.iloc[cnt-1]['Close']>df.iloc[cnt]['Close'] and 
df.iloc[cnt-2]['Close']>df.iloc[cnt-1]['Close']: 

8 logger.debug ("calBuyPoints, decrease for 2 days." + 
df.iloc[cnt] ['Date']) 

9 logger.debug("obv on first day is:" + 
str(df.iloc[cnt-2] ['OBV'])) 

10 logger.debug ("obv on second day is:" + 
str(df.iloc[cnt-1] ['OBV'])) 

11 logger.debug ("obv on third day is:" + str(df.iloc[cnt]['OBV'])) 

2 if(df.iloc[cnt-1]['OBV']<df.iloc[cnt] ['OBV'] and 
df.iloc[cnt-2] ['OBV']<df.iloc[cnt-1] ['OBV']): 

13 buyDate = buyDate+df.iloc[cnt]['Date'] + ',' 

14 cnt=cnt+1 

5 return buyDate 

16 

17 def calSellPoints (df) : 

18 cnt=0 

Ts, sellDate="'" 

20 while cnt<=len (df)-1: 

2 if(cnt>=5) : # 前 几 天 有 误差 ， 从 第 5 天 算 起 

22 # 卖点 规则 : 股价 连续 两 天 上 涨 ， 而 OBV 连续 两 天 下 跌 

23 if df.iloc[cnt-1] ['Close']<df.iloc[cnt]['Close'] and 
df.iloc[cnt-2] ['Close']<df.iloc[cnt-1] ['Close']: 

24 logger.debug ("calSellPoints, increase for 2 days." + 
df.iloc[cnt]['Date']) 

之 5 logger .debug("obv on first day is:" + 
str(df.iloc[cnt-2]['OBV'])) 

26 logger.debug ("obv on second day is:" + 
str(df.iloc[cnt-1] ['OBV'])) 

27 logger.debug ("obv on third day is:" + str(df.iloc[cnt]['OBV'])) 

28 if(df.iloc[cnt-1]['OBV']>df.iloc[cnt]['OBV'] and 
df.iloc[cnt-2] ['OBV']>df.iloc[cnt-1] ['OBV']): 

29 sellDate = sellDate+df.iloc[cnt]['Date’'] + ',"' 


30 cnt=cnt+1 
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3 return sellDate 

在 第 1 行 计算 买点 的 方法 中 ,首先 是 通过 第 4 行 的 while 循环 依次 遍历 每 个 交易 日 的 数据 , 在 
遍历 过 程 中 ， 先 通过 第 7 行 的 让 语句 判断 收盘 价 是 否 连续 两 天 下 跌 ， 如 果 满 足 的 话 ， 再 通过 第 12 
行 的 让 语句 判断 OBV 值 是 否 连续 两 天 上 涨 。 如 果 满 足 两 个 条 件 ， 则 在 第 13 行 的 语句 ， 把 当天 的 
日 期 记录 到 buyDate 变量 中 作为 买点 日 期 。 

而 第 17 行 的 计算 卖点 的 calSellPoints 方法 与 之 相反 , 首先 通过 第 23 行 的 代码 判断 收盘 价 是 否 
连续 两 天 上 涨 ， 如 果 是 的 话 ， 则 通过 第 28 行 的 语句 判断 OBV 值 是 否 连续 两 天 下 跌 ， 如 果 同 时 满 
足 两 个 条 件 ， 则 在 第 29 行 的 语句 ， 把 当天 的 日 期 记录 到 sellDate 变量 中 作为 卖点 日 期 。 

在 mainForm.py 文件 中 的 第 二 个 修改 之 处 是 ， 在 draw 方法 的 return 语句 之 前 ， 调 用 上 述 的 两 
个 方法 ,并 在 retur 语句 中 ,通过 buyDate 和 sellDate 两 个 参数 把 买点 日 期 和 卖点 日 期 传 到 stock.html 
页 面 ， 相 关 代码 如 下 。 

buyDate = calBuyPoints (df) 
sellDate = calSellPoints (df) 
return render(request, 'stock.html', { 
‘img': img,'stockCode':stockCode, 
"buyDate' :buyDate, 'sellDate' :sellDate}) 
在 stock.html 页 面 中 ， 添 加 如 下 两 行 显示 买点 日 期 和 卖点 日 期 的 代码 。 
1 买点 日 期 :{{ buyDate }}<br> 
双 卖点 日 期 :{{ sellDate }}<br> 

修改 完成 后 重启 服务 , 青 回 到 main.html 页 面 中 , 在 使 用 默认 股票 数据 的 前 提 下 再 单 击 “ 提 交 ” 
按钮 ， 即 可 看 到 如 图 12-9 所 示 的 结果 ， 其 中 的 图 形 和 之 前 图 12-8 中 的 完全 相同 ， 只 是 多 了 显示 买 
点 和 卖点 的 功能 。 


必 wN 


股票 代码 :600007 
买点 日 期 : 
卖点 日 期 : 


K 线 图 和 均线 图 


元 ) 


- 一 一 + 一 
LAR OD NE AE SA AE ESA 
NNN NON OR 


12-9 ”显示 基于 OBV 指标 的 买点 和 卖点 日 期 的 页 面 


多 
多 
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从 图 12-9 中 可 以 看 到 ， 目 前 没有 符合 上 述 买卖 点 策略 的 日 期 。 在 calBuyPoints 和 calSellPoints 
方法 中 已 经 加 入 了 向 控制 台 输 出 的 DEBUG 级 别 的 日 志 , 可 以 通过 日 志 来 验证 这 一 结果 ,比如 有 如 
下 的 日 志 。 

[2019-07-25 07:10:25,546] [DEBUG] calBuyPoints, decrease for 2 days.2019-01-10 
[2019-07-25 07:10:25,546] [DEBUG] obv on first day is:3.1010940000000002 
[2019-07-25 07:10:25,546] [DEBUG] obv on second day is:2.3395650000000003 
[2019-07-25 07:10:25,546] [DEBUG] obv on third day is:1.4282660000000003 
从 第 1 行 的 日 志 中 可 以 看 到 ， 在 计算 买点 的 方法 中 ， 虽 然 20190110 这 天 符合 第 一 个 条 件 ， 即 
收盘 价 连续 两 天 下 跌 ， 但 从 第 2 行 到 第 4 行 的 日 志 中 可 以 发 现 ，OBYV 值 并 没有 连续 两 天 上 升 ， 因 
此 不 把 这 一 天 作为 买点 日 期 的 判别 是 正确 的 。 

同 理 ， 经 过 验证 DEBUG 级 别 的 其 他 日 志 ， 也 可 以 发 现 根据 上 述 策略 ， 确 实 无 法 计算 出 买卖 
点 日 期 , 这 就 说 明 策 略 本 身 没 问 题 , 而 是 根据 股票 数据 在 指定 日 期 的 范围 内 没有 找到 匹配 该 策略 的 
买卖 点 日 期 。 


SODP 


12.5 ”本章 小 结 


在 本 章 的 开始 部 分 ， 给 出 了 在 Django 框架 内 引入 日 志 的 相关 用 法 ， 以 及 讲述 了 分 类 处 理 不 同 
级 别 日 志 的 方法 ; 之 后 介绍 了 Django 框架 与 MySQL 数据 库 的 整合 方式 ， 其 中 包含 了 通过 Model 
类 对 象 操作 数据 库 的 方法 和 直接 通过 SQL 语句 操作 数据 库 的 方法 。 

随后 本 章 借助 基于 OBV 指标 的 范例 程序 ， 示 范 了 在 Django 框架 内 整合 日 志和 数据 库 ， 涉 及 
第 11 章 介 绍 的 MVC 知识 ， 让 读者 体会 在 实际 环境 中 基于 Django 框架 开发 Web 项 目的 过 程 。 


以 股票 预测 和 学 例 入 门 机 器 学 习 


说 到 机 器 学 习 ， 大 家 或 许 会 望而却步 。 的 确 ， 如 果 要 从 复杂 的 数学 原理 开始 学 ， 读 懂 各 种 算 
法 ， 并 在 算法 的 基础 上 了 解 机 器 学 习 ， 这 确实 有 点 难 。 不 过 ， 在 Python 的 Sklearn 等 库 中 ， 已 经 封 
装 了 机 器 学 习 相关 算法 的 实现 。 

在 初学 阶段 ， 可 以 在 了 解 简单 原理 的 基础 上 ， 通 过 调用 相关 方法 来 实现 基于 机 器 学 习 的 预测 
功能 。 因 此 , 在 本 章 中 会 用 通俗 易 懂 的 文字 来 向 读者 介绍 机 器 学 习 的 原理 以 及 关键 性 步骤 ， 并 通过 
调用 相关 的 方法 ， 单 纯 地 从 数学 角度 预测 股票 价格 。 

和 本 书 的 目的 一 样 ， 本 章 的 核心 目的 不 是 “深入 讲解 ”， 而 是 “帮助 读者 入 门 机 器 学 习 ”， 
在 读 完 本 章 的 文字 描述 和 范例 程序 后 ， 相 信 读 者 会 对 机 器 学 习 中 基于 线性 回归 和 SVM 的 预测 方法 
有 一 定 的 了 解 ， 这 样 读者 在 今后 的 学 习 过 程 中 ， 以 此 为 基础 继续 深入 机 器 学 习 领 域 。 


13.1 用 线性 回归 算法 预测 股票 


线性 回归 是 机 器 学 习 中 的 常用 算法 ， 它 是 用 数理 统计 中 的 回归 分 析 方 法 来 确定 两 个 或 两 个 以 
上 变量 问 的 相互 依赖 关系 。 

在 本 节 中 ， 不 会 讲述 过 于 复杂 的 线性 回归 的 数学 公式 ， 而 是 在 简单 描述 其 数学 原理 的 基础 上 ， 
调用 Sklearn 库 中 封装 的 相关 方法 ， 来 实现 线性 回归 的 预测 功能 。 


13.1.1 安装 开发 环境 库 


Scikit-leam (Skleam) 是 Python 语言 在 机 器 学 习 领 域 常用 的 模块 ， 在 其 中 封装 了 经 常 使 用 的 
机 器 学 习 的 方法 《Method) ， 比 如 封装 了 回归 (Regression) 和 分 类 (Classification〉 等 方法 。 在 
本 章 中 ， 将 用 它 来 进行 机 器 学 习 的 相关 开发 ， 具 体 的 安装 步骤 如 下 。 
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C301 进入 “命令 提示 符 ” 窗 口 ， 到 pip .exe 所 在 的 目录 ， 在 其 中 执行 pip install scipy 命令 
安装 SciPy 库 ， 因 为 这 个 库 是 安装 Skleam 库 的 必要 条 件 。 
人 完成 后 再 通过 pip install skleam 命令 安装 Skleam 库 。 


13.1.2 ”从 波士顿 房价 范例 初 识 线性 回归 


安装 好 Sklearn 库 后 ， 在 安装 包 下 的 路 径 中 就 能 看 到 描述 波士顿 房价 的 csv 文件 ， 具 体 路 径 是 
“python 安装 路 径 \Lib\site-packages\sklearn\datasets\data”， 比 如 安装 路 径 是 D 盘 的 Python34 目录 ， 
那么 在 \Lib\site-packages\sklearn\datasets\data 目录 中 就 能 看 到 如 图 13-1 所 示 的 数据 文件 。 


加 BD: ‘python34\Lib\site-packaees\sklearn\datasets\data 


上 包 娃 一 个 新 文件 赤 a 


将 这 个 文件 夹 发 布 到 
Web 


oston_ house prices ]| breast_cancer. csv 


13-1 包含 波士顿 房价 数据 的 csv 文件 


在 这 个 目录 中 还 包含 了 Skleam 库 会 用 到 的 其 他 数据 文件 ， 本 节 用 到 的 是 包含 在 
boston_house_prices.csv 文件 中 的 波士顿 房价 信息 。 打 开 这 个 文件 , 可 以 看 到 如 图 13-2 所 示 的 数据 。 


有 [3 5 5 E 下 5 H I J K L 
506 13 

CRIN 三 INDUS CHAS NOX RM ACE DIS RAD TAX PTRATIO B LSTAT 。 JEDV 
0. 00632 18 2 0 0.538 6.575 65.2 4.09 1 296 15.3 396.9 4.98 24 
0. 02731 0 7.07 0 0.469 6.421 78.9 4.9671 2 242 17.8 396.9 9.14 21.6 
0. 02729 0 7.07 0 0.469 7.185 61.1 4.9671 2 242 17.8 392.83 4.03 34.7 
0.03237 0 2.18 0 0.458 6.998 45.8 6.0622 3 222 18.7 394.63 2.94 33.4 
0. 06905 0 2.18 0 0.458 7.147， 54.2 6.062: 3 222 18.7 396.9 5,33 36.2 
0. 02985 0 2.18 0 0.458 6.43 58.7 6.0622 3 222 18.7 394.12 5.21 28.7 


13-2 ”boston_house_prices.csv 文件 中 的 部 分 波士顿 房价 数据 


第 1 行 的 506 表示 该 文件 中 包含 506 条 样本 数据 ， 即 有 506 条 房价 数据 ， 而 13 表示 有 13 个 
影响 房价 的 特征 值 ， 即 从 A 列 到 M 列 这 13 列 的 特征 值 数 据 会 影响 第 N 列 MEDV 〈 即 房价 值 ) ， 
在 表 13-1 中 列 出 了 部 分 列 的 英文 标题 及 其 含义 。 


表 13-1 波士顿 房价 文件 部 分 中 英文 标题 一 览 表 
标题 名 | 中 文 含义 标题 名 中 文 含义 


CRIM _| 城镇 人 均 犯罪 率 DIS 到 波士顿 五 个 中 心 区 域 的 加 权 距 离 
ZN 住宅 用 地 超过 某 数值 的 比例 “| RAD 辐射 性 公路 的 接近 指数 

INDUS | 城镇 非 零 售 商 用 土地 的 比例 ”| TAX 每 10000 美元 的 全 值 财产 税率 
查理 斯 河 相 关 变 量 ， 如 边界 是 

CHAS 河流 则 为 1， 否则 为 0 PTRATIO | 城镇 师 生 比例 

NOX 一 氧化 氮 浓 度 MEDV 是 自 住房 的 平均 房价 

RM 住宅 平均 房间 数 

1940 年 之 前 建成 的 自用 房屋 

比例 
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从 表 13-1 中 可 以 看 到 , 波士顿 房价 的 数值 ( 即 MEDV) 和 诸如 “住宅 用 地 超过 某 数值 的 比例 ” 
等 13 个 特征 值 有 关 。 而 线性 回归 要 解决 的 问题 是 ， 量 化 地 找 出 这 些 特征 值 和 目标 值 〈( 即 房价 ) 的 
线性 关系 ， 即 找 出 如 下 的 kl 到 k13 系数 的 数值 和 b 这 个 常量 值 。 


MEDV =kl*CRIM + k2*ZN +...+k13*LITAT+b 


上 述 参 数 有 13 个 ， 为 了 简化 问题 ， 先 计算 1 个 特征 值 (DIS) 与 房价 (MEDV) 的 关系 ， 然 
后 在 此 基础 上 讲述 13 个 特征 值 与 房价 关系 的 计算 方式 。 

如 果 只 有 1 个 特征 值 DIS， 它 与 房价 的 线性 关系 表达 式 如 下 所 示 。 在 计算 出 kl 和 b 的 值 以 后 ， 
如 果 再 输入 对 应 DIS 值 ， 即 可 据 此 计算 MEDYV 的 值 ， 以 此 实现 线性 回归 的 预测 效果 。 


MEDV=kl*DIS+b 


在 下 面 的 OneParamLR.py 范例 程序 中 ， 通 过 调用 Skleam 库 中 的 方法 ， 以 训练 加 预测 的 方式 ， 
推算 出 一 个 特征 值 (DIS) 与 目标 值 (MEDV， 即 房价 ) 的 线性 关系 ， 该 范例 程序 文件 名 中 的 LR 
是 线性 回归 英文 Linear Regression 的 缩写 。 

# !/usr/bin/env Python 

# coding=utf-8 

import numpy as np 

import pandas as pd 

import matplotlib.pyplot as plt 

from sklearn import datasets 

from sklearn.linear model import LinearRegression 


在 上 述 代码 中 导入 了 必要 的 库 ， 其 中 第 6 行 和 第 7 行 用 于 导入 sklearn 相关 库 。 


8 “”# 从 文件 中 读数 据 ， 并 转换 成 DataFrame 格式 

9 dataset=datasets.load boston() 

10 data=pd.DataFrame (dataset .data) 

11 data.columns=dataset.feature names # 特征 值 

12 data['HousePrice']=dataset.target # 房价 ， 即 目标 值 

13”# 这 里 单纯 计算 离 中 心 区 域 的 距离 和 房价 的 关系 

14 dis=data.loc[0:data['DIS'].size-1,'DIS'] .as matrix() 

15 housePrice=data.loc[0:data['HousePrice'] .size-1,'HousePrice'] .as matrix() 


在 第 9 行 中 ， 加 载 了 Sklearn 库 下 的 波士顿 房价 数据 文件 ， 并 赋值 给 dataset 对 象 。 在 第 10 行 
通过 dataset.data 读 取 了 文件 中 的 数据 。 在 第 11 行 通过 dataset.feature_name 读 取 了 特征 值 ， 如 前 文 
所 述 , data.columns 对 象 中 包含 了 13 个 特征 值 。 在 第 12 行 通过 dataset.target 读 取 目 标 值 , 即 MEDV 
列 的 房价 ， 并 把 目标 值 设置 到 data 的 HousePrice 列 中 。 

在 第 14 行 读 取 了 DIS 列 的 数据 ， 并 调用 as_matrix 方法 把 读 到 的 数据 转换 成 矩阵 中 一 列 的 格 
式 ， 如 图 13-3 所 示 。 


aowmwewn 


4.09 
4. 9671 
4. 9671 


一 共 506 行 
13-3 ”DIS 转换 成 矩阵 的 格式 
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在 第 15 行 中 ， 是 用 同样 的 方法 把 房价 数值 转换 成 矩阵 中 列 的 格式 ， 如 图 13-3 所 示 。 


# 转 置 一 下 ， 否 则 数据 是 竖 排 的 
dis=np.array([dis]).T 
housePrice=np.array([housePrice]).T 
# 训练 线性 模型 
lrTool=LinearRegression() 
lrTool.fit(dis,housePrice) 

# 输出 系数 和 截 距 

Print (LIrTool.coef ) 

print (lrTool.intercept ) 


由 于 当前 在 dis 和 housePrice 变量 中 保存 的 是 “ 列 ” 形 式 的 数据 , 因此 在 第 16 行 和 第 17 行 中 ， 


需要 把 它们 转换 成 行 形式 的 数据 。 


在 第 20 行 中 ， 通 过 调用 LinearRegression 方法 创建 了 一 个 用 于 线性 回归 分 析 的 IrTool 对 象 ， 


在 第 21 行 中 ,通过 调用 fit 方 法 进行 基于 线性 回归 的 训练 。 这 里 训练 的 目的 是 , 根据 传 入 的 一 组 特 
征 值 dis 和 目标 值 MEDV， 推 算出 MEDV =kl*DIS + b 公式 中 的 kl 和 b 的 值 。 


调用 人 tt 方法 进行 训练 后 ，lrTool 对 象 就 内 含 了 系数 和 截 距 等 线性 回归 相关 的 参数 ， 通 过 第 23 


行 的 打印 语句 输出 了 系数 ， 即 参数 kl 的 值 ， 而 第 24 行 的 打印 语句 输出 了 截 距 ， 即 参数 b 的 值 。 
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# 画图 显示 

plt.scatter (dis,housePrice,label='Real Data') 

plt.plot (dis,lrTool.predict (dis),c='R',linewidth="'2',1abel='Predict') 
# 验证 数据 

print (dis[0]) 

print (lrTool .predict (dis) [0]) 

print (dis[2]) 

print (lrTool .predict (dis) [2]) 


plt.legend (loc='best') # 绘制 图 例 
plt.rcParams['font.sans-serif']=['SimHei'] 
plt .title ("DIS 与 房价 的 线性 关系 ") 

Plt.xlabel ("DIS") 

plt.ylabel ("HousePrice") 

plt.show() 


在 第 26 行 中 ,通过 调用 scatter 方法 绘制 出 x 值 是 DIS, y 值 是 房价 的 诸多 散 点 , 第 27 行 则 是 


调用 plot 方 法 绘制 出 DIS 和 预测 结果 的 关系 ， 即 一 条 直线 。 


之 后 就 是 用 Matplotlib 库 中 的 方法 绘制 出 x 轴 y 轴 文 字 和 图 形 标题 等 信息 。 运行 上 述 代码 ， 即 


可 看 到 如 图 13-4 所 示 的 结果 。 


图 13-4 中 各 个 点 表示 真实 数据 ， 每 个 点 的 x 坐标 是 DIS 值 ，y 坐标 是 房价 。 红 线 则 表示 根据 


当前 DIS 值 ， 通 过 线性 回归 预测 出 的 房价 结果 。 
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DIS 与 房价 的 线性 关系 


EE| emp ee ee — Predict 
ow by ® Real Data 


HousePr ice 


13-4 根据 DIS 特征 值 预测 房价 的 结果 图 


下 面 通过 输出 的 数据 ， 进 一 步 说 明 图 13-3 中 以 红线 形式 显示 的 预测 数据 的 含义 。 通 过 代码 的 
第 23 行 和 第 24 行 输出 了 系数 和 截 距 ， 结 果 如 下 。 

[[1.09161302]] 

[18.39008833] 

即 房价 和 DIS 满足 如 下 的 一 次 函数 关系 : MEDV = 1.09161302*DIS + 18.39008833。 

从 第 29 行 到 第 32 行 输出 了 两 组 DIS 和 预测 房价 数据 ， 每 两 行 是 一 组 ， 结 果 如 下 。 

[4.09] 

[22.85478557] 

[4.9671] 

[23.81223934] 

在 已 经 得 到 的 公式 中 ，MEDYV = 1.09161302*DIS + 18.39008833， 把 第 1 行 的 4.09 代入 DIS， 
把 第 2 行 的 22.85478557 代入 MEDV， 发 现 结果 吻合 。 同 理 ， 把 第 3 行 的 DIS 和 第 4 行 MEDYV 值 
代入 上 述 公式 ， 结 果 也 吻合 。 

也 就 是 说 ， 通 过 基于 线性 回归 的 人 t 方法 ， 训 练 了 IrTool 对 象 ， 使 之 包含 了 相关 参数 ， 这 样 如 
果 输 入 其 他 的 DIS 值 ， 那 么 IrTool 对 象 根据 相关 参数 也 能 算出 对 应 的 房价 值 。 

从 可 视 化 的 效果 来 看 ， 用 DIS 预测 MEDYV 房价 的 效果 并 不 好 ， 原 因 是 毕竟 只 用 了 其 中 一 个 特 
征 值 。 不 过 , 通过 这 个 范例 程序 ,还 是 可 以 看 出 基于 线性 回归 实现 预测 的 一 般 步 骤 : 根据 一 组 (506 
条 ) 数据 的 特征 值 (本 范例 中 是 DIS) 和 目标 值 〈 房 价 ) ， 调 用 fit 方法 训练 Tool 等 线性 回归 中 
的 对 象 ， 让 它 包含 相关 系数 ， 随 后 再 调用 predict 方法 ， 根 据 由 相关 系数 组 成 的 公式 ， 通 过 计算 预 
测 目标 结果 。 

看 到 这 里 ， 读 者 可 能 会 产生 两 大 问题 。 第 一 ， 上 例 中 的 特征 值 数量 就 一 个 ， 如 果 遇 到 多 个 特 
征 值 情况 该 怎么 办 呢 ? 比 如 在 这 个 波士顿 房价 范例 中 ， 如 何 通过 13 个 特征 值 来 预测 ? 第 二 ， 在 诸 
如 fit 等 计算 方法 的 内 部 ， 是 怎么 通过 机 器 学 习 确 定 参数 的 ? 在 后 续 的 章节 中 , 将 讲述 这 两 大 问题 。 
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13.1.3 ”实现 基于 多 个 特征 值 的 线性 回归 


在 13.1.2 小 节 的 范例 中 ， 特 征 值 的 数量 就 一 个 ， 如 果 要 用 到 波士顿 房价 范例 中 13 个 特征 值 来 
进行 预测 ， 那 么 对 应 的 公式 如 下 ， 这 里 要 做 的 工作 是 ， 通 过 fit 方法 ,计算 如 下 的 kl 到 k13 系数 以 
及 b 截 距 值 。 

MEDV =kl*CRIM + k2*ZN + ...+kl3*LITAT+b 

在 下 面 的 MoreParamLR.py 范例 程序 中 ， 实 现 用 13 个 特征 值 预测 房价 的 功能 。 


# !/usr/bin/env python 
# coding=utf-8 
from sklearn import datasets 
from sklearn.linear model import LinearRegression 
import matplotlib.pyplot as plt 
# 加 载 数据 
dataset = datasets.load boston() 
# 特征 值 集合 ， 不 包括 目标 值 房价 
featureData = dataset .data 
0 housePrice = dataset.target 


在 第 7 行 中 加 载 了 波士顿 房价 的 数据 ， 在 第 9 行 和 第 10 行 分 别 把 13 个 特征 值 和 房价 目标 值 
放 入 featureData 和 housePrice 这 两 个 变量 中 。 
11 1rTool = LinearRegression() 
12 lrTool.fit(featureData, housePrice) 
13 # 输出 系数 和 截 距 
14 print(lrTool.coef ) 
15 print(lrTool.intercept ) 


上 述 代码 和 前 文 推算 一 个 特征 值 和 目标 值 关系 的 代码 很 相似 ， 只 不 过 在 第 12 行 的 fit 方法 中 ， 
传 入 的 特征 值 是 13 个 ， 而 不 是 1 个 。 在 第 14 行 和 第 15 行 的 程序 语句 同样 输出 了 各 项 系数 和 截 距 
数值 。 
16 ”# 画图 显示 
17 plt.scatter (housePrice,housePrice,1label='Real Data') 
18 plt.scatter (housePrice,l1lrTool .predict (featureData),c='R',1label='Predicted 
Data') 
19 plt.legend(1loc='best') # 绘制 图 例 
20 plt.rcParams['font.sans-serif']=['SimHei'] 
21 plt.xlabel ("House Price") 
22 plt.ylabel ("Predicted Price") 
23 plt.show() 


在 第 17 行 绘制 了 x 坐标 和 y 坐标 都 是 房价 值 的 散 列 点 ， 这 些 点 表示 原始 数据 ， 在 第 19 行 绘 
制 散 列 点 时 ，x 坐标 是 原始 房价 ，y 坐标 是 根据 线性 回归 推算 出 的 房价 。 

运行 上 述 代码 ， 即 可 看 到 如 图 13-5 所 示 的 结果 。 其 中 蓝 色散 列 点 表示 真实 数据 ， 红 色散 列 点 
表示 预测 出 的 数据 ， 和 图 13-4 相 比 ， 预 测 出 的 房价 结果 数据 更 靠近 真实 房价 数据 ， 这 是 因为 这 次 
用 了 13 个 特征 值 来 预测 ， 而 在 图 13-4 中 只 用 了 其 中 一 个 特征 数据 来 预测 。 


POIoAwGDOp 
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图 13-5 根据 13 个 特征 值 来 预测 房价 的 结果 图 


另外 ， 从 控制 台中 可 以 看 到 由 第 14 行 和 第 15 行 的 程序 语句 打印 出 的 各 项 系数 和 截 距 。 


尘 [-1.08011358e-01 4.64204584e-02 2.05586264e-02 2.68673382e+00 
-1.77666112e+01 3.80986521le+00 6.92224640e-04 -1.47556685e+00 
3.06049479e-01 -1.23345939e-02 -9.52747232e-01 9.31168327e-03 
-5.24758378e-01] 

2 36.459488385089855 
其 中 ， 第 1 行 表 示 13 个 特征 值 的 系数 ， 而 第 2 行 表示 截 距 。 代 入 上 述 系数 ， 即 可 看 到 如 下 的 

13 个 特征 值 与 目标 房价 的 对 应 关系 一 一 预测 公式 。 得 出 如 下 的 公式 后 , 再 输入 其 他 的 13 个 特征 值 ， 

即 可 预测 出 对 应 的 房价 。 


MEDYV = -1.08011358e-01*CRIM + 4.64204584e-02*ZN + ... + -5.24758378e-01*LITAT 
+ 36.459488385089855 


13.1.4 全 函数 训练 参数 的 标准 和 方法 


在 13.1.3 小 节 ， 首 先 介绍 了 通过 fit 方法 来 计算 出 房价 和 DIS 关系 的 一 元 线性 函数 的 系数 和 常 
数 项 ， 其 中 该 方法 学 习 了 506 个 DIS 和 房价 的 样本 ， 并 在 此 基础 上 用 一 次 函数 拟 合 了 两 者 的 关系 。 
MEDV = k*DIS+b 
在 上 述 公 式 中 ， 将 用 fit 方法 计算 出 来 的 k 和 b 来 推算 房价 ， 在 计算 k 和 b 的 值 时 ， 希 望 预 测 
值 和 真实 值 误 差 最 小 ， 这 里 需要 用 “方差 ”评估 误差 。 
比如 已 经 有 若干 个 值 ，(k1,，b1)，(k2, b2)...，(kn，bn)， 怎 么 评估 哪 组 预测 出 的 房价 最 准 呢 ? 
Sklearn 库 中 的 fit 方法 将 用 506 个 DIS 值 来 训练 (也 可 以 说 是 学 习 ) ， 有 具体 的 步骤 如 下 。 


人 EX6i 把 第 一 个 DIS 的 真实 数据 4.09 代入 ， 算 出 k1*4.09 +b1， 得 到 一 个 房价 值 ml。 
E302 计算 ml 和 4.09 对 应 的 真实 房价 ( 即 24 ) 的 方差 s1， 具体 算法 是 ，sl 等 于 24-ml 的 
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平方 ， 用 sl 这 个 方差 来 评估 预测 结果 ml 和 真实 房价 24 的 偏离 程度 。 

CI03 同 理 , 以 J2*4.9671 +b2 计算 第 二 个 DIS 真实 数据 4.9671 预测 出 的 房价 m2， 再 计算 
m2 与 该 DIS 对 应 真实 房价 21.6 的 方差 m2, 如 果 m2 小 于 ml, 那么 说 明 用 (k2，b2) 参 数 预测 出 的 房 
价 要 比 用 (k1，b1) 参 数 预 测 出 的 房价 要 准 ， 反 之 亦 然 ， 同 理 计 算出 剩 下 (kn, bn) 预 测 出 的 房价 与 真实 
房价 的 方差 。 


在 只 有 !1 个 特征 值 的 应 用 场景 中 ， 是 用 “方差 ”来 训练 ， 在 有 13 个 特征 值 的 应 用 场景 中 ， 方 
法 是 一 样 的 ， 即 用 多 组 已 知 的 值 kkl, k2.…kn, b) 预 测 房价 ， 再 计算 预测 结果 与 真实 房价 的 方差 ， 方 
差 越 小 说 明 预 测 越 准 ， 也 可 以 说 是 用 方差 来 训练 的 。 

在 训练 过 程 中 ， 会 用 到 数学 分 析 理 论 中 的 最 小 二 乘法 ， 这 里 不 讲 具 体 的 公式 ， 因 为 Skleam 库 
已 经 封装 了 这 个 方法 ， 我 们 直接 使 用 即 可 。 归 纳 一 下 ， 请 记得 如 下 的 结论 。 


(1) 在 机 器 学 习 的 训练 过 程 中 ， 需 要 有 个 标准 来 评估 训练 效果 ， 本 章 范 例 用 的 是 方差 ， 在 其 
他 场景 中 也 可 以 用 其 他 的 标准 ， 甚 至 可 以 自己 定义 评估 的 标准 。 

(2) 在 训练 过 程 中 ， 会 用 到 数学 方法 ， 本 章 范例 用 的 是 最 小 二 乘法 ， 在 其 他 场景 中 可 能 会 遇 
到 其 他 方法 。 不 过 , 其实 没有 必要 在 完全 理解 数学 公式 含义 的 基础 上 才 去 开发 机 器 学 习 的 功能 (如 
果 能 理解 当然 更 好 ) ， 因 为 Python 的 机 器 学 习 的 相关 库 中 已 经 封装 了 相关 数学 公式 。 


13.1.5 ”训练 集 、 验 证 集 和 测试 集 


在 13.1.4 小 节 ， 选 择 把 训练 的 主动 权 交 给 了 “最 小 二 乘法 ”， 也 就 是 说 ， 没 有 人 工 干预 训练 
过 程 。 不 过 在 某 些 场合 中 ,需要 在 训练 过 程 中 ,根据 训练 的 结果 与 真实 数据 间 的 误差 ,动态 地 改变 
训练 参数 甚至 训练 策略 ， 这 时 候 就 需要 引入 “验证 集 ” 和 “测试 集 ”， 先 来 看 一 下 相关 的 概念 。 

一 般 会 把 样本 数 的 60% 作 为 训练 集 ， 比 如 在 波士顿 房价 范例 中 ， 把 总 数 为 506 条 样本 数据 中 
60% 的 数据 用 来 计算 各 项 参数 。 

一 般 也 会 把 20% 的 样本 数 作 为 验证 集 ， 验 证 集 不 会 像 训 练 集 一 样 参 与 拟 合 参数 等 工作 ， 而 是 
专门 被 用 来 验证 调整 训练 参数 乃至 训练 策略 后 的 结果 ， 以 此 不 断 优化 训练 过 程 。 

而 测试 集 的 比例 一 般 也 是 20%， 它 不 参与 训练 ， 而 且 也 不 能 像 验 证 集 那样 作为 调整 训练 参数 
以 及 调整 训练 策略 等 的 依据 ， 测 试 集 是 用 来 评估 最 终 训练 结果 的 优 劣 程度 。 

在 给 出 相关 的 范例 程序 前 ， 请 记 住 如 下 的 结论 : 


(1) 在 采用 同一 种 训练 策略 和 训练 参数 的 前 提 下 ， 如 果 把 原本 属于 训练 集 的 样本 划分 给 验证 
集 和 训练 集 ， 一 定 会 降低 预测 的 准确 性 ， 从 这 角度 来 看 ， 划 分 验证 集 和 测试 集 是 有 代价 的 。 

(2) 划分 出 验证 集 和 测试 集 后 ， 可 以 动态 地 调整 训练 过 程 ， 并 可 以 根据 测试 集 评估 训练 后 的 
结果 ,这 就 是 付出 代价 后 得 到 的 收获 。 换 句 话说 , 如 果 有 必要 在 训练 过 程 中 进行 调整 并 评估 训练 结 
果 ， 这 才 有 必要 再 划分 验证 集 和 测试 集 。 

(3) 训练 集 、 验 证 集 和 测试 集 的 比例 一 般 是 6:2:2， 不 过 这 不 是 绝对 的 ， 可 以 根据 需要 适当 地 
调整 。 而 且 ， 如 果 不 涉 及 动态 调整 ， 则 无 须 划 分 验证 集 。 

在 下 面 的 MoreParamLRWithTestSet.py 范例 程序 中 , 将 把 样本 划分 成 训练 集 和 测试 集 ， 用 训练 
集 来 计算 13 个 特征 值 的 参数 和 常数 项 ， 再 用 测试 集 来 评估 训练 的 结果 。 
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# !/usr/bin/env Python 

# coding=utf-8 

import numpy as np 

from sklearn import datasets 

from sklearn.model selection import train test split 
from sklearn.linear model import LinearRegression 
import matplotlib.pyplot as plt 


oaum 必 wwNP 


9 dataset = datasets.load boston () 

10 ”# 特征 值 集合 ， 不 包括 目标 值 房价 

11 featureData = dataset.data 

12 housePrice = dataset.target 

13 划分 训练 集 和 测试 集 ， 测 试 集 的 比例 是 10% 

14 featureTrain， featureTrainTest, housePriceTrain, housePriceTest = 
train test split(featureData, housePrice, test size=0.1) 


在 第 11 行 把 特征 值 放 入 featureData 对 象 ， 在 第 12 行 把 目标 房价 放 入 housePrice 对 象 。 在 第 
14 行 的 train_test_split 方法 中 ， 分 别 把 特征 值 和 房价 目标 值 划分 为 训练 集 和 测试 集 ， 而 且 通 过 
test_size=0.1 指定 测试 集 的 大 小 是 10%。 

在 调用 该 方法 生成 训练 集 和 测试 集 时 ， 返 回 了 4 个 参数 ， 其 中 featureTrain 和 featureTrainTest 
分 别 表示 特征 值 的 训练 集 和 测试 集 , 而 housePriceTrain 和 housePriceTest 分 别 表示 目标 房价 的 训练 
15 ”# 构建 线性 回归 对 象 
16 lrTool = LinearRegression() 
17 ”# 用 训练 集 来 拟 合 参 数 
18 lrTool.fit(featureTrain, housePriceTrain) 
19 # 用 训练 集 绘图 
20 plt.scatter (housePriceTrain,l1rTool .predict (featureTrain) vc='R'yv 

label='Predicted Data') 

21 plt.scatter (housePriceTrain,housePriceTrain,label='Real Data') 


请 注意 , 在 18 行 通过 fit 方法 训练 时 ,是 用 训练 集 , 而 不 是 像 之 前 那样 用 特征 值 和 目标 值 的 全 
集 来 训练 。 而 且 ， 在 第 20 行 和 第 21 行 绘制 散 点 图 时 ， 也 是 基于 训练 集 来 绘制 的 。 
22 ，# 用 测试 集 来 计算 方差 
23 predictByTest = lrTool.predict (featureTrainTest) 
24”# 用 测试 集 计算 方差 
25 testResult = np.sum(((predictByTest - housePriceTest) ** 2) / 
len (housePriceTest) ) 
26 print(testResult) 
27 PlLt.show() 


第 23 行 的 程序 语句 通过 特征 值 的 测试 集 计 算出 了 目标 房价 的 预测 结果 ， 并 在 第 25 行 计算 了 
基于 特征 值 预测 结果 和 房价 测试 集 之 间 的 方差 ,以 此 来 量化 训练 结果 , 由 此 可 知 测试 集 的 目的 主要 
是 用 于 验证 。 

运行 上 述 代 码 ， 即 可 看 到 如 图 13-6 所 示 的 结果 ， 而 且 可 以 在 控制 台 看 到 输出 的 方差 结果 是 
17.025243707185318， 由 此 可 以 量化 地 分 析 预 测 结果 和 真实 结果 的 偏差 。 

在 这 个 例子 中 ， 由 于 在 训练 时 ， 使 用 了 特征 值 或 目标 房价 的 样本 ， 也 就 是 说 训练 前 后 样本 值 
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有 可 能 变化 ， 因 此 需要 专门 保留 一 定 比例 的 测试 集 ， 以 便 用 来 评估 线性 回归 的 结果 。 另 外 ， 在 本 范 
例 程序 中 ， 因 为 只 用 了 一 种 算法 来 训练 ， 所 以 无 须 划分 出 验证 集 。 


50 


13-6 ”用 训练 集 预测 房价 的 线性 回归 的 结果 图 


13.1.6 ”预测 股票 价格 


在 13.1.5 小 节 ， 讲述 了 线性 回归 的 概念 以 及 Sklearn 库 中 的 相关 方法 ， 还 讲述 了 通过 测试 集 来 


评估 训练 结果 的 方式 。 在 此 基础 上 ， 在 本 节 中 将 在 下 面 的 predictStockByLR.py 范例 程序 中 ， 根 据 
股票 历史 的 开盘 价 、 收 盘 价 和 成 交 量 等 特征 值 ， 从 数学 角度 来 预测 股票 未 来 的 收盘 价 。 


Poo 


# !/usr/bin/env python 

# coding=utf-8 

import pandas as pd 

import numpy as np 

import math 

import matplotlib.pyplot as plt 

from sklearn.linear model import LinearRegression 
from sklearn.model selection import train test split 
# 从 文件 中 获取 数据 

origDf = pd.read csv('D:/stockData/ch13/6035052018-09-012019-05-31.csv', 
encoding='gbk') 

df = origDf[['Close', '‘'High', 'Low','Open' ,'Volume']] 
featureData = df[['Open', 'High', 'Volume','Low']] 

# 划分 特征 值 和 目标 值 

feature = featureData.values 

target = np.array (df['Close']) 


第 10 行 的 程序 语句 从 包含 股票 信息 的 csv 文件 中 读 取 数据 ,在 第 14 行 设置 了 特征 值 是 开盘 价 、 


最 高 价 、 最 低 价 和 成 交 量 ， 同 时 在 第 15 行 设置 了 要 预测 的 目标 列 是 收盘 价 。 


在 后 续 的 代码 中 ， 需 要 将 计算 出 开盘 价 、 最 高 价 、 最 低 价 和 成 交 量 这 四 个 特征 值 和 收盘 价 的 


线性 关系 ， 并 在 此 基础 上 预测 收盘 价 。 
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16 才 划分 训练 集 ， 测 试 集 


17 feature train, feature test, target train ,target _ test = 
train test split(feature,target,test size=0.05) 
18 pridectedDays = int (math.ceil(0.05 * len(origDf))) # 预测 天 数 
19 lrTool = LinearRegression() 
20 lrTool.fit(feature train,target train) # 训练 
21 ，# 用 测试 集 预测 结果 
22 predictByTest = lrTool.predict (feature test) 


第 17 行 的 程序 语句 通过 调用 train_test_split 方 法 把 包含 在 csv 文 件 中 的 股票 数据 分 成 训练 集 和 
测试 集 ， 这 个 方法 前 两 个 参数 分 别 是 特征 列 和 目标 列 ， 而 第 三 个 参数 0.05 则 表示 测试 集 的 大 小 是 
总 量 的 0.05。 该 方法 返回 的 四 个 参数 分 别 是 特征 值 的 训练 集 、 特征 值 的 测试 集 、 要 预测 目标 列 的 训 
练 集 和 目标 列 的 测试 集 。 

第 18 行 的 程序 语句 计算 了 要 预测 的 交易 日 数 ， 在 第 19 行 中 构建 了 一 个 线性 回归 预测 的 对 象 ， 
在 第 20 行 是 调用 人 tt 方法 训练 特征 值 和 目标 值 的 线性 关系 , 请 注意 这 里 的 训练 是 针对 训练 集 的 , 在 
第 22 行 中 ， 则 是 用 特征 值 的 测试 集 来 预测 目标 值 〈 即 收盘 价 ) 。 也 就 是 说 ， 是 用 多 个 交易 日 的 股 
价 来 训练 FTool 对 象 ， 并 在 此 基础 上 预测 后 续 交 易 日 的 收盘 价 。 至 此 ， 上 面 的 程序 代码 完成 了 相关 
的 计算 工作 。 

23 # 组 装 数据 
24 index=0 


25 ## 在 前 95% 的 交易 日 中 ， 设 置 预测 结果 和 收盘 价 一 致 
26 while index < len(origDf) - pridectedDays: 


2 df.ix[index, 'predictedVal']=origDf.ix[index,'Close'] 
28 df.ix[index, 'Date']=origDf.ix[index, 'Date'] 
29 index = index+1 


30 predictedcnt=0 
31 # 在 后 5% 的 交易 日 中 ， 用 测试 集 推算 预测 股价 
32 while PredictedCnt<pridectedDays : 


jo df.ix[index, 'predictedVal']=predictByTest [PredictedCnt] 
34 df.ix[index,'Date']=origDf.ix[index,'Date'] 

3 PredictedCnt=predictedCnt+1 

36 index=index+1 


在 第 26 行 到 第 29 行 的 while 循环 中 ， 在 第 27 行 把 训练 集 部 分 的 预测 股价 设置 成 收盘 价 ， 并 
在 第 28 行 设 置 了 训练 集 部 分 的 日 期 。 

在 第 32 行 到 第 36 行 的 while 循环 中 ,遍历 了 测试 集 ， 在 第 33 行 的 程序 语句 把 df 中 表示 测试 
结果 的 predictedVal 列 设置 成 相应 的 预测 结果 ， 同 时 也 在 第 34 行 的 程序 语句 逐 行 设置 了 每 条 记录 
中 的 日 期 。 


37 plt.figure() 

38 df['predictedVal'] .plot (color="red",label='predicted Data') 
39 dfl['Close'] .plot(color="blue",label='Real Data') 

40 plt.legend (loc='best') # 绘制 图 例 

41 # 设置 x 坐标 的 标签 

42 major index=df.index[df.index%10==0] 

43 major xtics=df['Date'] [df.index%10==0] 

44 plt.xticks (major index,major xtics) 
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45 plt.setp(plt.gca() .get xticklabels(), rotation=30) 
46 ”# 带 网 格 线 ， 且 设置 了 网 格 样式 
47 plt.grid(linestyle='-.') 
48 plt.show() 
在 完成 数据 计算 和 数据 组 装 的 工作 后 ， 从 第 37 行 到 第 48 行程 序 代 码 的 最 后 ， 实 现 了 可 视 化 。 
第 38 行 和 第 39 行 的 程序 代码 分 别 绘制 了 预测 股价 和 真实 收盘 价 ， 在 绘制 的 时 候 设置 了 不 同 
的 颜色 ， 也 设置 了 不 同 的 label 标签 值 ， 在 第 40 行 通过 调用 legend 方法 ， 根 据 收 盘 价 和 预测 股价 
的 标签 值 ， 绘 制 了 相应 的 图 例 。 
从 第 42 行 到 第 45 行 设置 了 x 轴 显 示 的 标签 文字 是 日 期 ， 为 了 不 让 标签 文字 显示 过 密 ， 设 置 
了 “每 10 个 日 期 里 只 显示 1 个 ”的 显示 方式 ， 并 且 在 第 47 行 设置 了 网 格 线 的 效果 ， 最 后 在 第 48 
行 通过 调用 show 方法 绘制 出 整个 图 形 。 运 行 本 范例 程序 ， 即 可 看 到 如 图 13-7 所 示 的 结果 。 


一 predicted Data 
20 十 -一 Real Data 
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图 13-7 用 线性 回归 方法 预测 股票 价格 的 结果 图 


从 图 13-7 中 可 以 看 出 ， 蓝 线 表示 真实 的 收盘 价 (图 中 完整 的 线 ) ， 红 线 表示 预测 股价 〈 图 中 
靠 右 边 的 线 。 因 为 本 书 黑白 印刷 的 原因 ,在 书 中 读者 看 不 到 蓝 色 和 红色 , 请 读者 在 自己 的 计算 机 上 
运行 这 个 范例 程序 即 可 看 到 红 蓝 两 色 的 线 ) 。 虽 然 预测 股价 和 真实 价 之 间 有 差距 , 但 涨 跌 的 趋势 大 
致 相同 。 而 且 在 预测 时 没有 考虑 到 涨 跌停 的 因素 ， 所 以 预测 结果 的 涨 跌幅 度 比 真实 数据 要 大 。 

股票 价格 不 仅 由 技术 层面 决定 ， 还 受 政策 方面 、 资 金 量 以 及 消息 面 等 诸多 因素 的 影响 ， 这 也 
能 解释 预测 结果 和 真实 结果 间 有 差异 的 原因 。 


13.2 通过 SVM 预测 股票 涨 跌 


SVM 是 英文 Support Vector Machine 的 缩写 , 中 文 名 为 支持 向 量 机 , 通过 它 可 以 对 样本 数据 进 
行 分 类 。 以 股票 为 例 , SVM 能 根据 若干 特征 样本 的 数据 , 把 要 预测 的 目标 结果 划分 成 “ 涨 ” 和 “ 跌 ” 


268 | 基于 股票 大 数据 分 析 的 Python 入 门 实战 ( 视频 教学 版 ) 


两 种 ， 从 而 实现 对 股票 涨 跌 的 预测 。 


13.2.1 通过 简单 的 范例 程序 了 解 SVM 的 分 类 作用 


在 Sklearn 库 中 ， 同 样 封装 了 SVM 分 类 的 相关 方法 ， 也 就 是 说 ， 我 们 无 须 了 解 其 中 复杂 的 算 
法 ， 即 可 用 它 实 现 基 于 SVM 的 分 类 。 在 本 节 中 ， 通 过 下 面 SimpleSVMDemo.py 范例 程序 ， 来 看 一 
下 使 用 SVM 库 实现 分 类 的 用 法 以 及 相关 方法 的 调用 方式 。 


1 # !/usr/bin/env Python 

2 # coding=utf-8 

3 import numpy as np 

4 import matplotlib.pyplot as plt 

from sklearn import svm 

6 ”# 给 出 平面 上 的 若干 点 

points = np.z_ [[[-1,1], [1.5,1.5], [1.8,0.2], [0.8;0.7], [2.2,2.8], 
[2.5,3.5], [4,2]]] 

# 按 0 和 1 标记 成 两 类 

9 typeName = [0,0,0,0,1,1,1] 


第 5 行 的 程序 语句 导入 了 基于 SVM 的 库 。 在 第 7 行 定义 了 若干 个 点 , 并 在 第 9 行 把 这 些 点 分 
成 了 两 类 ， 比 如 [-1,1] 点 是 第 一 类 ， 而 [4,2] 是 第 二 类 。 

请 注意 ， 在 第 7 行 定义 点 的 时 候 ， 是 通过 npx 方法 把 数据 转换 成 “ 列 矩 阵 ”， 这 样 做 的 目的 
是 让 数据 结构 满足 fit 方法 的 要 求 。 
10 # 建立 模型 
11 svmTool = svm.SVC (kernel='linear') 


12 svmTool.fit(points,typeName)  # 传 入 参数 
13 ”=# 确立 分 类 的 直线 


op 


14 sample = svmTool.coef_[0] # 系数 
15 slope = -sample[0]/sample[1] # 斜率 
16 linex = np.arange(-2,5,1) # 获取 -2 到 5， 间 距 是 1 的 若干 数据 


17 lineY = slope*lineX- (svmTool.intercept_ [0])/sample[1] 


在 第 11 行 中 , 创建 了 基于 SVM 的 对 象 ， 并 指定 该 SVM 模型 采用 比较 常用 的 “线性 核 ”来 实 
现 分 类 操作 。 
第 12 行 通过 调用 fit 方法 训练 样本 , 这 里 的 fit 方法 和 之 前 基于 线性 回归 范例 程序 中 的 fit 方法 
是 一 样 的 ， 只 不 过 这 里 是 基于 线性 核 的 相关 算法 , 而 之 前 是 基于 线性 回归 的 相关 算法 (比如 最 小 二 
乘法 ) 。 
训练 完成 后 ， 通 过 第 14 行 和 第 15 行 的 程序 代码 得 到 了 可 以 分 隔 两 类 样本 的 直线 ， 包 括 直线 
的 斜率 和 截 距 ， 并 通过 第 16 行 和 第 17 行 的 程序 代码 设置 了 分 隔 线 的 若干 个 点 。 
18 ## 画 出 划分 直线 
19 plt.plot(linex,lineY,color='blue',label='Classified Line') 
20 plt.legend (loc='best') # 绘制 图 例 
21 plt.scatter(points[:,0],points[:,1],c="'R') 
22 plt.show() 
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计算 完成 后 ， 通 过 调用 第 19 行 的 plot 方法 绘制 了 分 隔 线 ， 并 在 第 21 行 调用 scatter 方法 绘制 
所 有 的 样本 点 。 由 于 points 是 “ 列 矩 阵 ” 的 数据 结构 ， 因 此 是 用 points[:,0] 来 获取 绘制 点 的 x 坐标 ， 
用 points[:,1] 来 获取 y 坐标 ， 最 后 是 通过 调用 第 22 行 的 show 方法 来 绘制 图 形 。 

运行 这 个 范例 程序 ， 即 可 看 到 如 图 13-8 所 示 的 结果 ， 从 图 中 可 以 看 到 ， 边 界线 能 有 效 地 分 隔 
两 类 样本 。 


-一 Classified Line 


-2 -1 0 1 2 3 4 


图 13-8 简单 SVM 的 示例 结果 


从 这 个 例子 可 以 看 到 ，SVM 的 作用 是 : 根据 样本 训练 出 可 以 划分 不 同 种 类 数据 的 边界 线 ， 由 
此 实现 “分 类 ”的 效果 。 而 且 ， 在 根据 训练 样本 确定 好 边界 线 的 参数 后 ， 还 可 以 根据 其 他 没有 明确 
种 类 的 样本 ， 计 算出 它 的 种 类 ， 以 此 实现 “预测 ”。 


13.2.2 ”数据 标准 化 处 理 


标准 化 (Normalization) 处 理 是 将 特征 样本 按 一 定 算法 进行 缩放 ， 让 它们 落 在 某 个 范围 比较 小 
的 区 间 内 ， 同 时 去 掉 单位 限制 ， 让 样本 数据 转换 成 无 量 纲 的 纯 数值 。 

在 用 机 器 学 习 进行 训练 时 ， 一 般 需 要 对 训练 数据 进行 标准 化 处 理 ， 原 因 是 Sklearn 等 库 封装 的 
一 些 机 器 学 习 算 法 对 样本 有 一 定 的 要 求 , 如 果 有 些 特征 值 的 数量 级 偏离 大 多 数 特征 值 的 数量 级 , 或 
者 有 些 特征 值 偏离 正 态 分 布 ， 那 么 预测 结果 就 不 准确 。 

需要 说 明 的 是 ， 虽 然 在 训练 前 对 样本 进行 了 标准 化 处 理 ， 改 变 了 样本 值 ， 但 由 于 在 标准 化 的 过 程 
中 是 用 同一 个 算法 对 全 部 样本 进行 转换 ， 属 于 “数据 优化 ”， 不 会 对 后 续 的 训练 起 到 不 好 的 作用 。 

下 面 通过 Sklearn 库 提 供 的 preprocessing.scale 方法 实现 标准 化 , 该 方法 是 让 特征 值 减 去 平均 值 
然后 除 以 标准 差 。 下 面 通过 ScaleDemo.py 范例 程序 来 实际 示范 一 下 preprocessing.scale 方法 。 
# !/usr/bin/env python 
# coding=utf-8 
from sklearn import preprocessing 
import numpy as np 


origVal = np.array ([[10,5,3], 
[8,6,12], 
[14,7,15]]) 


oAOGODOPp 
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9 ”# 计算 均值 


10 avgOrig = origVal.mean (axis=0) 

11 # 计算 标准 差 

12 stdOrig=origVal.std(axis=0) 

13 ”# 减 去 均值 ， 除 以 标准 差 

14 print((origVal-avgOrig)/stdorig) 

15 scaledVal=preprocessing.scale(origVal) 
16 # 直接 输出 preprocessing.scale 后 的 结果 

17 Print(scaledVal) 


第 6 行 初始 化 了 一 个 长 宽 各 为 3 的 矩阵 , 在 第 10 行 通过 调用 mean 方法 计算 了 该 矩阵 的 均值 ， 
在 第 12 行 则 通过 调用 std 方法 来 计算 标准 差 。 

第 14 行 是 用 原始 值 减 去 均值 ， 再 除 以 标准 差 ， 在 第 17 行 是 直接 输出 preprocessing.scale 的 结 
果 。 第 14 行 和 第 17 行 的 输出 结果 相同 ， 如 下 所 示 。 

[[-0.26726124 -1.22474487 -1.37281295] 


有 
2 [-1.06904497 0. 0.39223227] 
3 [ 1.33630621 1.22474487 0.98058068]] 


13.2.3 ”预测 股票 涨 跌 


在 13.2.1 小 节 的 范例 程序 中 ， 用 基于 SVM 的 方法 ,通过 一 维 直线 来 分 类 二 维 的 点 。 据 此 可 以 
进一步 推论 : 通过 基于 SVM 的 方法 ， 还 可 以 分 类 具有 多 个 特征 值 的 样本 。 
比如 可 以 通过 开盘 价 、 收 盘 价 、 最 高 价 、 最 低 价 和 成 交 量 等 特征 值 ， 用 SVM 的 算法 训练 出 这 
些 特征 值 和 股票 “ 涨 ” 和 “ 跌 ” 的 关系 ， 即 通过 特征 值 划分 指定 股票 “ 涨 ” 和 “ 跌 ” 的 边界 。 采 用 
这 种 方法 ， 一 旦 输入 其 他 的 股票 特征 数据 ， 即 可 预测 出 对 应 的 涨 跌 情况 。 
在 下 面 的 PredictStockBySVM.py 范例 程序 中 , 给 出 了 基于 SVM 预测 股票 涨 跌 的 功能 , 这 个 范 
例 程序 比较 长 ， 下 面 逐 段 说 明 。 
1 # !/usr/bin/env Python 
2 # coding=utf-8 
3 import pandas as pd 
4 from sklearn import svm,preprocessing 
本 import matplotlib.pyplot as plt 
6 origDf=pd.read csv('D:/stockData/ch13/ 
6035052018-09-012019-05-31.csv',encoding="'gbk') 
df=origDf[['Close', ‘'High', 'Low','Open’' ,'Volume','Date']] 
8 ”# diff 列表 示 本 日 和 上 日 收盘 价 的 差 
9 df['diff'] = df["Cclose"]-df["Close"] .shift(1) 
10 df['diff'] .fillna(0, inplace = True) 
11 ## up 列表 示 本 日 是 否 上 涨 ，1 表示 涨 ，0 表示 跌 
2 "del pl = AFl"dLEs"] 
a3 dtl"up liadtt"aLtel>0) = 1 
14 df['up'] [df["'diff']<=0] = 0 
15 # 预测 值 暂且 初始 化 为 0 
16 df['predictForUp'] = 0 


第 6 行 从 指定 的 csv 文件 读 取 股票 数据 ,该 csv 格式 文件 中 的 股票 数据 其 实 是 从 网 站 候 取 到 的 ， 
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具体 做 法 可 以 参考 前 面 的 章节 。 

第 9 行 设置 了 df 的 diff 列 为 本 日 收盘 价 和 前 日 收盘 价 的 差 值 ， 通 过 第 12 行 到 第 14 行 的 程序 
代码 , 设置 了 up 列 的 值 ， 具 体 的 执行 过 程 是 : 如 果 当 日 股票 上 涨 ， 即 本 日 收盘 价 大 于 前 日 收盘 价 ， 
则 up 值 是 1; 反之 ， 如 果 当 日 股票 下 跌 ，up 值 则 为 0。 

第 16 行 的 程序 语句 在 df 对象 中 新 建 了 表示 预测 结果 的 predictForUp 列 , 该 列 的 值 暂且 都 设置 
为 0， 在 后 续 的 代码 中 ， 将 根据 预测 结果 填充 这 列 的 值 。 

17 # 目标 值 是 真实 的 涨 跌 情 况 

18 target = df['up'] 

19 length=len (df) 

20 trainNum=int (length*0.8) 

21 predictNum=length-trainNum 

22 ## 选择 指定 列 作为 特征 列 

23 feature=df[['Close', 'High', 'Low','Open' ,'Volume']] 
24 ”# 标准 化 处 理 特征 值 


25 feature=preprocessing.scale (feature) 

在 第 18 行 中 设置 了 训练 目标 值 为 表示 涨 跌 情 况 的 up 列 ， 在 第 20 行 设置 了 训练 集 的 数量 是 总 
量 的 80%， 在 第 23 行 则 设置 了 训练 的 特征 值 ， 请 注意 这 里 去 掉 了 日 期 这 个 不 相关 的 列 ， 而 且 在 第 
25 行 对 特征 值 进 行 了 标准 化 处 理 。 

26 ## 训练 集 的 特征 值 和 目标 值 

27 featureTrain=feature[0:trainNum] 

28 targetTrain=target[0:trainNum] 

29 svmTool = svm.SVC (kernel='linear') 

30 svmTool.fit (featureTrain,targetTrain) 

在 第 27 行 和 第 28 行 中 通过 截取 指定 行 的 方式 ， 得 到 了 特征 值 和 目标 值 的 训练 集 ， 在 第 26 行 
中 以 线性 核 的 方式 创建 了 SVM 分 类 器 对 象 svmTool。 

在 第 30 行 中 通过 调用 fit 方法 ， 用 特征 值 和 目标 值 的 训练 集 来 训练 svmTool 分 类 对 象 。 如 前 
文 所 述 ， 训练 所 用 的 特征 值 是 开盘 收盘 价 、 最 高 价 、 最 低 价 和 成 交 量 ， 训 练 所 用 的 目标 值 是 描述 涨 
跌 情况 的 up 列 。 在 训练 完成 后 ，svmTool 对 象 中 就 包含 了 用 于 划分 股票 涨 跌 的 相关 参数 。 

31 PredictedIndex=trainNum 
32 ”# 逐 行 预测 测试 集 
33 while predictedIindex<length: 


34 testFeature=feature[predictedIndex:predictedIndex+1] 
I predictForUp=svmTool .predict (testFeature) 

36 df.ix[predictedIindex, 'predictForUp']=predictForUp 
3 PredictedIndex = predictedIndex+1 


在 第 33 行 的 while 循环 中 ， 通 过 predictedIndex 索引 值 ， 依 次 遍历 测试 集 。 在 遍历 过 程 中 , 通 
过 调用 第 35 行 的 predict 方 法 ， 用 训练 好 的 svmTool 分 类 器 ， 逐 行 预测 测试 集中 的 股票 涨 跌 情 况 ， 
并 在 第 36 行 中 把 预测 结果 设置 到 df 对 象 的 predictForUp 列 中 。 
38 二 该 对 象 只 包含 预测 数据 ， 即 只 包含 测试 集 
39 dfWithPredicted = df[trainNum:length] 


40 # 开始 绘图 ， 创 建 两 个 子 图 
41 figure = plt.figure() 
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42 ”# 创建 子 图 

43 (axClose, axUpOrDown) = figure.subplots (2， sharex=True) 

44 dfWwithPredicted['Close'] .plot (ax=axClose) 

45 dfWithPredicted['PredictForUP'] .plot (ax=axUpOrDown,color="red", 
label='Predicted Data') 

46 dfWithPredicted['up'] .plot (ax=axUpOrDown,color="blue",label='Real Data') 

47 plt.legend (loc='best') # 绘制 图 例 

48 ”# 设置 x 轴 坐标 的 标签 和 旋转 角度 

49 major index=dfWithPredicted.index[dfWithPredicted.index%2==0] 

50 major xtics=dfWithPredicted['Date'] [dfWithPredicted.index%2==0] 

51 plt.xticks (major index,major xtics) 

52 plt.setp(plt.gca().get xticklabels(), rotation=30) 

53 plt.title ("通过 svM 预 测 603505 的 涨 跌 情 况 ") 

54 plt.rcParams['font.sans-serif']=['SimHei'] 

55 plt.show() 


由 于 在 之 前 的 代码 中 只 设置 测试 集 的 predictForUp 列 , 并 没有 设置 训练 集 的 该 列 数据 , 因此 在 
第 39 行 中 ， 用 切片 的 手段 ， 把 测试 集 数据 放置 到 dfWithPredicted 对 象 中 ， 请 注意 这 里 切片 的 起 始 
值 和 结束 值 是 测试 集 的 起 始 和 结束 索引 值 。 至 此 就 完成 了 数据 准备 工作 ， 在 之 后 的 代码 中 ， 将 用 
Matplotlib 库 开 始 绘图 。 

在 第 43 行 中 ， 通 过 调用 subplots 方法 设置 了 两 个 子 图 ， 并 通过 sharex=True 让 这 两 个 子 图 的 x 
轴 有 具有 相同 的 刻度 和 标签 。 在 第 44 行 的 程序 代码 中 ， 调 用 plot 方法 在 axClose 子 图 中 绘制 了 收盘 
价 的 走势 。 第 45 行 的 程序 代码 在 axUpOrDown 子 图 中 绘制 了 预测 到 的 涨 跌 情况 ， 而 第 46 行 的 程 
序 代码 ， 还 是 在 axUpOrDown 子 图 中 绘制 了 这 些 交 易 日 期 间 股票 真实 的 涨 跌 情况 。 

在 从 第 49 行 到 第 52 行 的 程序 语句 中 ， 设 置 了 x 标签 的 文字 以 及 旋转 角度 ， 目 的 是 让 标签 文 
字 看 上 去 不 至 于 太 密 集 。 第 53 行 的 程序 语句 用 于 设置 了 中 文 标题 ， 由 于 要 显示 中 文 ， 因 此 需要 第 
54 行 的 代码 ， 最 后 在 第 55 行 通过 调用 show 方法 显示 出 整个 图 形 。 

运行 这 个 范例 程序 ， 即 可 看 到 如 图 13-9 所 示 的 结果 。 
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图 13-9 通过 SVM 预测 股票 涨 跌 的 结果 图 
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图 13-9 显示 了 收盘 价 ， 下 图 的 蓝 色 线 条 表示 真实 的 涨 跌 情况 ，0 表示 下 跌 ，1 表示 上 涨 ,而 红 
色 线条 表示 预测 后 的 结果 。 

对 比 一 下 ， 虽 有 偏差 ,但 大 体 相 符 。 综 上 所 述 ， 本 范例 程序 从 数学 角度 演示 了 通过 SVM 进行 
分 类 , 包括 如 何 划 分 特征 值 和 目标 值 ,如 何 对 样本 数据 进行 标准 化 处 理 , 如 何 用 训练 数据 训练 SVM， 
以 及 如 何 用 训练 后 的 结果 预测 分 类 结果 。 


13.2.4 ”定量 观察 预测 结果 


在 前 面 的 章节 中 , 采用 线性 回归 和 SVM 等 算法 完成 了 预测 工作 后 ， 通 过 可 视 化 的 方式 观察 预 
测 的 结果 ， 这 种 方式 虽然 直观 ， 但 没有 定量 分 析 。 

在 Sklearn 库 中 ， 还 提供 了 score 方法 用 于 定量 地 描述 预测 结果 ， 比 如 ， 在 13.2.3 小 节 的 范例 
程序 中 ,可 以 在 调用 svmTool.fit 方法 后 ， 像 下 面 第 7 行 的 程序 语句 那样 调用 score 方法 来 评估 预测 
的 结果 ， 即 给 预测 结果 评分 。 

1 ，## 省 略 之 上 的 代码 

2 ”# 训练 集 的 特征 值 和 目标 值 

六 featureTrain=feature [0:trainNum] 

4 targetTrain=target [0:trainNum] 

5: svmTool = svm.SVC (kernel='linear') 

6 svmTool .fit (featureTrain,targetTrain) 

A Print (svmTool .score (featureTrain,targetTrain)) 

8 predictedIindex=trainNum 
9 ”# 逐 行 预测 测试 集 
10 while PredictedIndex<length: 
11 # 省 略 之 后 的 代码 


一 般 来 说 ， 该 方法 的 调用 主体 是 训练 对 象 ， 比 如 这 里 是 完成 调用 fit 方 法 后 的 svmTool 对 象 ， 
而 常用 参数 是 特征 值 和 目标 值 。 加 上 该 方法 之 后 ， 再 次 运行 这 段 代 码 ， 就 能 在 控制 台中 看 到 预测 结 
果 的 评分 ， 比 如 0.7803030303030303。 这 个 值 一 般 介 于 0 与 1 之 间 ， 越 接近 1 分 表示 越 好 。 

而 在 通过 线性 回归 模型 预测 股票 的 predictStockByLR.py 范例 程序 中 ， 也 可 以 加 入 score 方法 ， 
如 第 7 行 的 代码 所 示 。 

1 “ 间 省 略 之 前 的 代码 
2 ”# 划分 训练 集 ， 测 试 集 
3 feature train, feature test, target train ,target test = 

train test _ split (feature,target, test_ size=0.05) 

4 pridectedDays = int(math.ceil(0.05 * len(origDf))) # 预测 天 数 
3 lrTool = LinearRegression() 

6 lrTool.fit(feature train,target train) # 训练 

7 

8 


Po 


print (lrTool.score (feature train,target train)) 
# 用 测试 集 预 测 结果 

9 predictByTest = lrTool .predict (feature test) 

10 # 组 装 数据 

11 index=0 

12 ”# 省 略 之 后 的 代码 
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这 里 调用 的 主体 是 经 过 fit 方法 训练 后 的 线性 回归 IrTool 对 象 ， 参 数 还 是 特征 值 和 目标 值 ， 运 
行 后 同样 可 以 在 控制 台中 看 到 对 预测 结果 的 评分 。 


13.3 “本章 小 结 


在 本 章 中 ， 虽 然 没有 高 深 的 机 器 学 习 算法 的 描述 ， 但 不 影响 大 家 入 门 机 器 学 习 。 本 章 首先 用 
Sklearn 库 自 带 的 波士顿 房价 数据 ， 让 读者 了 解 了 基于 线性 回归 的 机 器 学 习 相关 的 知识 ， 包 括 如 何 
在 特征 值 训练 的 基础 上 预测 目标 值 , 如 何 划 分 训练 集 和 测试 集 , 并 在 此 基础 上 给 出 了 基于 线性 回归 
预测 股票 价格 的 范例 程序 。 

随后 ， 通 过 范例 程序 讲述 了 SVM 分 类 器 的 用 法 ， 数 据 标准 化 处 理 ， 最 后 给 出 了 基于 SVM 预 
测 股 票 涨 跌 的 范例 程序 。 

相信 通过 本 章 的 学 习 ， 大 家 能 感受 到 ， 其 实用 Python 入 门 机 器 学 习 并 不 难 ， 这 将 为 大 家 今后 
继续 深入 了 解 机 器 学 习 领 域 打 下 良好 的 基础 。 


